Сибирь / Новости 6 мая 2024 г. 12:40

Искусственный интеллект написал "Тотальный диктант" лучше, чем ожидали ученые

*** Нейросеть хорошо знает грамматику, но не всегда верно слышит слова

Новосибирск. 6 мая. ИНТЕРФАКС - Разработанная в Новосибирском госуниверситете нейросеть "Писец" в ходе "Тотального диктанта" 20 апреля продемонстрировала хорошие знания грамматики, но допустила ошибки в словах, которые услышала неверно, говорится в сообщении НГУ.

"Писцу" вполне можно было бы поставить твердую "тройку", если бы не несколько обстоятельств. Из 276 слов диктанта он пропустил шесть, пять из которых стояли в конце предложения, причем, в этих случаях он не ставил точку, но следующее предложение начинал с заглавной буквы. В одном месте пропустил предлог "в", шедший предпоследним в предложении. Еще семь слов им было услышано неверно. Например, вместо "наивысшего" искусственный интеллект написал "наявившего", - рассказывает старший преподаватель гуманитарного факультета НГУ Людмила Буднева, проверявшая диктант.

Также "Писец" написал вместо "клеенчатых" - "кальиончатых", вместо "Читай - не хочу" - "Считай, не хотите", обнаружились и проблемы в написании окончаний - "синями" (вместо "синими") и "портрет ... гимназистке" ("портрет ... гимназистки"), что считается орфографической ошибкой.

Еще одна "ослышка" привела к искажению смысла предложения. "Писец" вместо "так" написал "та". Получилось сложносочиненное предложение, где он поставил запятую, в итоге возникла речевая ошибка. Аналогичная грамматическая ошибка: вместо слова "способны" написано "способный" , в результате получилось: "способный лишь немногие".

Отмечается, что создатель "Писца" предполагал, что положительной оценки тот не получит - скорее всего, система допустит минимум орфографических ошибок, однако с расставлением знаков препинания вряд ли справится.

Разработчикам "Писца" было важно собрать статистику о разнообразии совершаемых им ошибок и неточностей, чтобы в дальнейшем усовершенствовать систему.

"Писец", тем не менее, вполне удовлетворительно расставил запятые и разбил текст на абзацы. В результате был сделал вывод: в тех местах, где "Писец" все слова услышал верно, он написал диктант хорошо - на границе между "тройкой" и "четверкой".

Изначально "Писец" разрабатывался год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций. Соответственно, даже 20-30% ошибок в расшифрованных текстах - это уже тот уровень, который позволяет человеку гораздо быстрее подготовить чистовой текст стенограммы, чем если бы он писал его "с нуля".

Опираясь на результаты "Писца", полученные на "Тотальном диктанте", разработчики уже наметили ближайшие направления исследований. В их числе - повышение устойчивости к шумам различного рода и др.