Штучний інтелект навчили вивчати мови

Штучний інтелект навчили вивчати мови

В останні роки комп 'ютери стали набагато більш майстерними в перекладі з однієї мови на іншу завдяки застосуванню нейронних мереж.

Однак для навчання ШІ зазвичай потрібно багато контенту, перекладеного людьми для комп 'ютерів.

Мікель Артекс, вчений-комп 'ютерник з Університету Країни Басків (UPV) і автор однієї з цих робіт, порівнює ситуацію з наданням комусь різних книг китайською мовою і різних книг арабською мовою, без будь-яких одних і тих же текстів, що перекривають один одного. Людині було б дуже важко навчитися перекладати з китайської на арабську мову при такому сценарії, але комп 'ютер може.


У типовому процесі машинного навчання система ШІ контролюється. Це означає, що коли ШІ намагається знайти правильну відповідь з будь-якої заданої проблеми, людина скаже, чи правильно це чи ні, і, в міру необхідності, ШІ буде вносити коригування.

Замість цього за новим методом ШІ вивчають те, як слова пов 'язані однаковим чином різними мовами - наприклад, слова "" стіл "" і "" стілець "" часто використовуються разом, незалежно від діалекту. Співставляючи ці поєднання для кожної мови, а потім порівнюючи їх, можна отримати гарне уявлення про те, які терміни пов 'язані один з одним.

Ці системи можуть використовуватися для перекладу повних речень, а не тільки окремих слів, використовуючи дві додаткові стратегії навчання. Зворотний переклад передбачає, що речення, написане однією мовою, грубо перекладається іншою, а потім назад на вихідну мову, при неспівпадінні ШІ налаштовує свої протоколи інакше. Шумоподавлення - процес, аналогічний такому ж процесу в радіотехніці, але вже зі словами, які видаляються або додаються в пропозицію. Синхронізація цих методів допомагає машині краще зрозуміти, як працює мова.

Тест-лексика

Обидві системи - одна з яких розроблена в UPV, а інша - комп 'ютерним вченим з Facebook Гійомом Ламплером, поки ще не отримали оцінку експертів, але обидві показали багатообіцяючі результати при попередньому тестуванні.

Для оцінки їх здатності перекладати текст з англійської мови на французьку і навпаки, були запропоновані до перекладу приблизно 30 мільйонів речень. Обидва ШІ зуміли отримати 15 балів. ІІ Google Translate, який використовує контрольоване машинне навчання, має оцінку 40 балів, в той час як перекладачі-люди можуть набирати до 50 балів.

Обидва дослідники згодні з тим, що кожен з них може поліпшити свою систему самонавчального ШІ, спираючись на роботу іншого. ШІ можна було б зробити більш здатними, ввівши кілька тисяч паралельних пропозицій в їх навчальну програму, що скоротило б час, необхідний для освоєння мови.