Машинный перевод против второклассников

2017-11-30 11:31

Каждый год в середине ноября статистику поисковых систем заполняет словосочетание «Русский медвежонок». Так называется конкурс для школьников по русскому языку и лингвистике, который в 2000 году по образцу международного конкурса по математике «Кенгуру» придумал математик из Кирова Игорь Рубанов и лингвист из Москвы Елена Муравенко.

Конкрус с тех пор стал очень популярным - в нём ежегодно участвуют больше двух миллионов школьников в России и других странах. Победа в «Медвежонке», в отличие от школьных олимпиад, не даёт никаких льгот или привилегий. Единственная цель конкурса - показать детям, что за скучным предметом «русский язык» может скрываться интересная деятельность: от решения головоломок или внезапного обнаружения древнего родства внешне непохожих слов до открытия языковых законов, которые изучает наука лингвистика.

Например, в этом году восьмиклассники получили возможность за две минуты немного разобраться в грамматике итальянского языка и обнаружить неточность в переводе названия оперы Моцарта:

Даны несколько слов и словосочетаний на итальянском языке и их перевод на русский: tutto ‘весь’, belli ragazzi ‘красивые юноши’, belle ragazze ‘красивые девушки’, famosi poeti ‘знаменитые поэты’, famose italiane ‘знаменитые итальянки’. Название оперы Вольфганга Амадея Моцарта “Сosì fan tutte” буквально переводится на русский язык «Так поступают все», однако для более точной передачи смысла обычно добавляют ещё одно слово. Какое?

(А) люди; (Б) мужчины; (В) музыканты; (Г) итальянцы; (Д) женщины.

(автор задачи - Пётр Аркадьев)

А четвероклассники смогли открыть для себя риторические вопросы и задуматься о функциях знаков препинания:

В XVI веке один английский издатель предложил для некоторых предложений использовать особый знак. Из пяти данных ниже вопросов учителей он подошёл бы к четырём. Определив его предназначение, выберите, для какого вопроса этот знак не подходит.

(А) А голову ты дома не забыл

(Б) Оценку вам тоже одну на двоих ставить

(В) Уроки за тебя делать Пушкин будет

(Г) Ты сделал домашнее задание

(Д) Третья парта, я вам не мешаю разговаривать

(автор задачи - Борис Иомдин)

Участник конкурса получает три десятка задач с выбором ответа (разных для разных классов), которые надо решить за два школьных урока. Конечно, предполагается, что школьники решают задачи самостоятельно. Но некоторым кажется, что вернее будет подсмотреть ответ в интернете. Вот и получается, что в день проведения конкурса запросы вроде «ответы к русскому медвежонку» выходят в топ поисковых систем.

Самым младшим участникам «Русского медвежонка» - ученикам 2-го и 3-го классов - в этом году была дана такая задача:

Вот несколько болгарских слов и их переводы на русский язык: вълк - волк, конче - жеребёнок, патка - утка, петел - петух, прасе - поросёнок, пиле - цыплёнок. Как по-болгарски будет «Русский медвежонок»?

(А) Руски медвежонок; (Б) Руско мече; (В) Руски мечок; (Г) Руски мишка; (Д) Руска мишка.

(автор задачи - Борис Иомдин)

В «Медвежонке» каждый год бывает несколько задач, посвященных не русскому, а другим языкам: в этом году, кроме итальянского и болгарского, это польский и готский. И каждый год возмущенные родители школьников пишут письма организаторам и изливают гнев на форумах:

«Почему мой сын второклассник должен знать польский или болгарский язык?»

«Почему на конкурсе ПО РУССКОМУ языку надо ПЕРЕВОДИТЬ иностранные слова? Где логика?»

«Вот проблема-то и в том как раз - олимпиада-то по РУССКОМУ языку, а не по логике. В наше время на олимпиадах по РУССКОМУ языку были совсем другие задания, не подвластные логике, а лишь только знанию правил и исключений русского языка»

«Ну пипец, помимо русского еще польский и болгарский надо знать чтобы правильно ответить»

«Вопрос-при чем тут польский и болгарский язык и зачем забивать этим и так прилично не по годам забитые детские головы? Когда будут "млеко, яйки, шнеле"?»

«Хотелось бы спросить Вас всех ,кто занимается составлением задач, для чего ученикам второго класса нужны столь сомнительные задачи, на которые можно ответить только "методом тыка"»

«Я просто понять не могу каким это все боком к русскому языку относится? Ну назвали бы тогда олимпиаду по логике или смекалке или еще как»

Многие уверены: русский язык - это не про логику, а про словарные слова, безударные гласные и запятые. А если задание школьного конкурса почему-то выходит за пределы орфографии и пунктуации, то это всё козни злонамеренных организаторов.

«Русский медвежонок» - не экзамен на знание русского или иностранных языков, а конкурс-игра с подзаголовком «Языкознание для всех». Его цель - заинтересовать школьников русским языком и лингвистикой, показать, чем похожи и чем различаются языки мира, продемонстрировать, что и второклассник может обнаружить языковую закономерность и даже перевести слова на язык, которого он не знает. Для решения задачи на болгарский язык совсем не требуется его знать - нужно лишь понимать, что русские слова жеребёнок, поросёнок, цыплёнок и медвежонок называют детёнышей животных, и увидеть, что по-болгарски все они заканчиваются одинаково (как и по-русски). Многие второклассники с этим справились.

Те, кто решил на собственную логику не рассчитывать, а поискать ответ в интернете, столкнулись с неожиданными проблемами. Современный пользователь интернета твёрдо знает: если попался текст на иностранном языке, можно легко перевести его в интернет-переводчике. Машинный перевод сейчас действительно очень активно развивается (в частности благодаря усилиям лингвистов - а многие из них в детстве успешно участвовали в лингвистических олимпиадах и конкурсах). Но всё же до сих пор онлайн-переводчики часто дают неверные или неточные результаты. Это происходит, в частности, потому, что современный машинный перевод обычно основан на статистических данных интернета, а не на анализе лексики и грамматики. А некоторые родители школьников уверены: авторы задач «Русского медвежонка» сами в языках ни бельмеса, а туда же, экзаменовать школьников.

«Если не знаешь болгарского языка, то надежда только на переводчик, хотя как раз тут возникли небольшие трудности. Детям на конкурсе точно придётся не легко».

«Ни один переводчик русско-болгарский не выдаёт перевод, который был бы у вас представлен в ваших вариантах ответов. Похоже, но не так. Сами, видимо, не знали и написали, как думали, примерно! Уж если вы решили использовать задание, которое может знать только тот, кто знает болгарский, и додуматься тут тоже невозможно, то хоть проявляйте больше ответственности и точности!»

«Ни один переводчик в интернете (их там множество) не выдает точно такого перевода, как представлено у вас в ответах. То есть даже с переводчиком точно определить между вариантом Б и В не представляется возможным. Это неправильно. Обратите на это внимание составителей теста».

Словосочетание «русский медвежонок» по-русски встречается в интернете очень часто (в основном благодаря названию конкурса), а по-болгарски - редко. Вот статистических данных и не хватает, чтобы перевести это словосочетание автоматически, не обращаясь к данным русско-болгарского словаря (где даны переводы слов) и болгарской грамматики (где, в частности, указано, как по-болгарски согласуется прилагательное с существительным). Поэтому некоторые интернет-переводчики в качестве перевода русского словосочетания русский медвежонок на болгарский язык выдают словосочетания русски мечета и руската мечка. Но первое из них означает ‘русские медвежата’ (во множественном, а не в единственном числе), а второе - ‘русский медведь’ (взрослый медведь, а не детёныш), с определённым артиклем. Существует по-болгарски и словосочетание руски мечок, данное в ответе (В) - те, кто не решал задачу сам, а искал ответ в интернете, его и выбрали. Однако оно означает не ‘русский медвежонок’, а ‘русский самец медведя’. Дело в том, что по-болгарски нейтральным названием медведя является слово женского рода мечка, а не слово мужского рода мечок (примерно так же, как нейтральным названием лисы по-русски является слово женского рода лиса, а не слово мужского рода лис). Слово же мече означает ‘медвежонок’ (детёныш медведя) или ‘мишка’ (маленький или игрушечный медведь). Слово мишка, кстати, по-болгарски тоже существует, но означает ‘мышь’.

Всё это легко увидеть в словарях. Но русско-болгарский словарь в интернете найти гораздо сложнее, чем онлайн-переводчик. На это и рассчитывали составители конкурса: хочется, чтобы в нём выигрывали честные школьники, которые решают задачи сами, а не слушают подсказки или подсматривают ответы в интернете.

Многие почему-то уверены: в школьном конкурсе не могут проверять сообразительность - только знания, а логика и лингвистика никак не связаны.

«Медвежонок - мече, а логики никакой. Вы хотели ее увидеть в "медвежонке"? Но ее и не было никогда».

Хорошо, что второклассники об этом не знают - они могли ещё ничего не слышать ни о лингвистике, ни о логике, а задачи каждый год решают с успехом. Один школьник в своё время победил в «Русском медвежонке» и так заинтересовался лингвистикой, что недавно получил премию «Просветитель» за книгу об искусственных языках. Кстати, на эсперанто интернет-переводчики уже научились переводить, но как сказать «Русский медвежонок», тоже пока не знают. А вы узнаете, если решите задачу, составленную специально для этой заметки:

Вот несколько слов на языке эсперанто и их переводы на русский язык: alkino - лосиха, anaso - утка, kokido - цыплёнок, porkido - поросёнок, ursino - медведица, virkoko - петух. Как на эсперанто будет «Русский медвежонок»?

(А) Rusa ursa; (Б) Rusa urso; (В) Ruso urso; (Г) Ruso urkido; (Д) Rusa ursido.

.

Аналог Ноткоин - TapSwap Получай Бесплатные Монеты

Подробнее читайте на

margin-left русский 54cm rsquo медвежонок lsquo 27cm язык