Обробка природної мови (NLP) - один з секторів що швидко зростає в області штучного інтелекту (AI) та машинного навчання (ML). За прогнозами Mordor Intelligence, до 2026 року світовий ринок NLP досягне 42,04 мільярда доларів, при цьому середньорічний темп зростання складе 21,5%.
Це експоненціальне зростання NLP також призведе до появи нових тенденцій та інновацій в галузі. Розглянемо деякі тенденції NLP, на які слід звернути увагу у 2021 році.
Трансферне навчання
Трансферне навчання (transfer learning) належить до техніки машинного навчання (ML), при якій модель навчається для головного завдання, а потім перенаправляється для виконання іншого, аналогічного завдання. Таким чином, замість розробки й навчання нової моделі з нуля ви можете просто оновити чинну модель, що значно економить час і вимагає набагато менше даних.
Наприклад, якщо ви навчите класифікатор передбачати, чи є на зображенні харчові продукти, ви також можете навчити його розпізнавати напої. Також, якщо ви навчите класифікатор розпізнавати одяг, ви можете навчити його розпізнавати й взуття.
Скорочення витрат буде одним з головних пріоритетів для компаній, що рухаються вперед, трансфертне навчання стане основною тенденцією NLP у 2021 році.
Розвиток мультимовного NLP
Великі міжнародні компанії виступають ініціаторами впровадження попередньо навчених багатомовних моделей NLP.
Facebook представив XLM-R у 2019 році та M2M-100 зовсім нещодавно, що є першою багатомовною моделлю перекладу. Вона може переводити на 100 мов без будь-якого англійського введення або даних.
Розквіт Low-Code інструментів
Раніше, якщо ви хотіли розробити модель NLP, вам були потрібні глибокі знання в області штучного інтелекту та машинного навчання, програмування, бібліотек з відкритим вихідним кодом і багато чого іншого. Більше ні, оскільки Low-Code інструменти спрощують задачу.
MonkeyLearn, SaaS-компанія, прагне демократизувати ML та NLP, роблячи їх доступними для нетехнічних користувачів. Компанія розробила конструктор моделей «point-and-click», який дозволяє створювати, навчати й інтегрувати моделі аналізу та класифікації тексту.
Взаємодія контрольованого та неконтрольованого навчання
Контрольоване навчання - це процес машинного навчання, який включає зіставлення введення і виведення на основі прикладів пар введення-виведення. З іншого боку, навчання без вчителя не включає пари введення-виведення або моделі навчання. Модель працює сама по собі аби розкрити потенційні можливості навчання.
Як контрольоване, так і неконтрольоване навчання мають свої переваги та недоліки. Хоча контрольоване навчання є більш конкретним і може бути корисним при розв'язанні завдань класифікації, його здатність справлятися зі складними завданнями обмежена. З іншого боку, навчання без вчителя корисно, оскільки не потрібно даних для маркування, що прискорює завдання класифікації. Але з іншого боку, це не дозволяє вам показувати або оцінювати результати.
Щоб подолати цей розрив між контрольованим і неконтрольованим навчанням, розробники рішень NLP комбінують дві моделі навчання. Це об'єднання двох моделей показало, що продуктивність моделей машинного навчання підвищується.
Аналіз настроїв в соціальних мережах
Соціальні мережі більше не місце, де люди діляться фотографіями з відпустки та тим, що вони їли на обід. Він став джерелом даних для компаній, оскільки кожен день на платформах соціальних мереж генерується величезна кількість даних. Однак дані необроблені, і зрозуміти всю інформацію вручну неможливо.
Мова, якою люди користуються в соціальних мережах, відрізняється від тієї, якою вони пишуть електронного листа або залишають відгук про продукт. Традиційні моделі NLP можуть насилу розрізняти нюанси одного й того ж слова.
Щоб подолати цю перешкоду розробники працюють над створенням моделі аналізу настроїв в соціальних мережах.
NLP у дії - кращі приклади використання
За минулі роки постачальники рішень NLP придумали інноваційні способи використання NLP. Ось деякі з прикладів:
Нейронний машинний переклад (NML): NML значно поліпшив спроби імітації професійного перекладу. Microsoft Bing представила концепцію NML, яка зараз використовується Amazon, Google та іншими технологічними гігантами.
Оцінка кредитоспроможності: банки в країнах, що розвиваються відмовилися від процедур ручної оцінки кредитоспроможності. Тепер вони використовують алгоритми NLP, які аналізують активність в соціальних мережах, дані геолокації, поведінку під час перегляду сторінок й іншу інформацію, яка допомагає банкам приймати обґрунтовані рішення щодо оцінки кредитоспроможності.
Чат-боти: Чат-боти існують вже багато років, і вони тільки стають розумнішими. Juniper Research прогнозує, що до 2022 року чат-боти зможуть обробляти 75-90% запитів. Чат-боти - один з кращих варіантів використання NLP у поєднанні з розпізнаванням голосу.
Аналіз настроїв: як ми вже говорили, аналіз настроїв є важливим додатком NLP. Компанії по всьому світу працюють, щоб побудувати моделі аналізу настроїв та краще зрозуміти своїх клієнтів.
Висновок
Оскільки додатки NLP продовжують рости, можна з упевненістю прогнозувати, що NLP буде відігравати важливу роль в загальному функціонуванні та прийнятті рішень в бізнесі. Організації будуть продовжувати впроваджувати штучний інтелект у свою діяльність, щоб отримати переваги в конкурентній боротьбі.
Джерело: whatech