Результаты (
русский) 2:
[копия]Скопировано!
1. Шутки о бесполезности машинного перевода предостаточно. Центральное разведывательное управление было сказано, что потратил миллионы, пытаясь программировать компьютеры, чтобы перевести с русского на английский. Лучшее, что удалось сделать, так сказка идет, было превращение знаменитого-русскую поговорку "Дух бодр, но плоть слаба" "в" водка хорошая, но мясо гнило ". К сожалению, эта история миф. Но машинного перевода, безусловно, производятся свою долю Howlers. С первых дней, подлежит страдает от завышенных требований и невозможных ожиданий.
2. Обман по-прежнему существует. Но японские исследователи, возможно, подстрекаемый языковой барьер, который часто кажется чтобы отделить ученых и техников своей страны от тех, в остальной части мира, не добились больших успехов в достижении цели надежного машинного перевода. - и теперь их усилия имитируется на Западе
3. До недавнего времени основными коммерческими пользователями перевод Программы были большие японские производители. Они полагаются на машинный перевод для первоначальные проекты их английских инструкций и продаж материала. (Это может помочь объяснить недоумение многие западные потребители чувствуют как они листать инструкции по их видеомагнитофонов.) Самая популярная программа для этого является EJ банк, который был разработан Нобуаки Kamejima, затворника мастера программного обеспечения на Ай Laboratories в Токио. Теперь, однако, больший рынок манит.
Взрыв иностранных языков (особенно японских и немецких) в Интернете превращается машинного перевода в основного бизнеса. Доля веб-сайтов, размещенных на английском языке, сократилось с 98% до 82% в течение последних трех лет, и тенденция по-прежнему вниз. Потребительского программного обеспечения, некоторые из них, написанной не-японских производителей программного обеспечения, в настоящее время становятся доступными для интерпретации данного электронного Бабеля к тем, кто не может его прочитать.
вариации Enigma
4. Машины для перевода с одного языка на другой были впервые заговорили в 1930 году. Ничего особенного не произошло, однако, до 1940 года, когда американский математик называется Уоррен Уивер были заинтригованы тем, как англичане использовали свою новаторскую Colossus компьютер, чтобы взломать военные коды, полученные с помощью шифрования машин в Германии загадкой. В меморандуме к своему работодателю, Фонд Рокфеллера, Уивер писал: "У меня есть текст передо мной, которое написано на русском, но я собираюсь делать вид, что это действительно написаны на английском языке, и что они были закодированы в какой-то странный символы. Все что мне нужно сделать, это сдирать код, чтобы получить информацию, содержащуюся в тексте ".
5. Самые ранние "машинного перевода" были основаны на этой прямой, так называемые «Трансформер», захода на посадку. Входные предложения исходного языка были преобразованы непосредственно в выходные предложений на целевом языке, используя простую форму анализа. Анализатор сделал грубую / анализ исходного предложения, разделив его на предмет, объект, глагол, и т.д. Источник слова заменяется целевых слов, выбранных из словаря, и порядок их переставить так, чтобы в соответствии с правилами мишени язык.
6. Это звучит просто, но это не так. Проблема с подходом Уивер была обобщена лаконично по Иегошуа Бар-Гиллель, лингвиста и философа, который задумался, какие чувства машина сделает предложение «ручка в коробке" (пишущий инструмент находится в контейнере) и Приговор "окно в загоне» (контейнер в [играть] пера).
7. Люди решать такие неясности в одном из двух способов. Либо они отмечают контекст предыдущих предложениях или они выводят значение в изоляции, зная определенные правила о реальном мире - в этом случае, что коробки больше, чем перьев (пишущие инструменты), но меньше, чем ручки (Манежи) и что большие объекты не могут поместиться внутри меньшего размера. Компьютеры, доступные для Уивер и его ближайших преемников не мог бы это удалось.
8. Но современные компьютеры, которые имеют больше вычислительной мощности засушливый больше памяти, может. Их двигатели переводчика в состоянии принять менее прямой подход, используя то, что называется "лингвистические знания". Именно это позволило г-н Kamejima производить EJ банк, а также позволила NeocorTech Сан-Диего, чтобы придумать цунами и тайфуна - первое программное обеспечение на японском языке, перевод бегать по стандарту (английской) версии Microsoft Windows .
9. Переводчики лингвистический-знания иметь два комплекта грамматической правило - один для исходного языка и один для мишени. Они также имеют много информации о идиоматических различий между языками, чтобы остановить их делает глупые ошибки.
10. Первый набор грамматических правил используется анализатором для анализа входного предложение ("я прочитал" Экономист "каждую неделю"). Приговор будет решена в дерево, которое описывает структурную связь между компонентами приговор в ("Я" [теме] ", читать" (глагол), "Экономист" (объект) и "каждую неделю" [Фраза изменения глагол]. До сих пор, процесс, как у трансформатора двигателя Уивер стиле. Но тогда все становится более сложным. Вместо того чтобы работать с заранее подготовленной формуле, генератор (я. е., анализатор в обратном) приводится в игру создать структуру предложения в целевом языке, он делает это с использованием словаря и сравнительной грамматики -. это набор правил шляпе описывает различие между каждым компонентом предложения на исходном языке и его аналогов в целевом языке, таким образом, мост. второй язык построен на глубоких структурных фондов.
11. Помимо того, что гораздо более точные, такие двигатели linguistic- знания должны, по идее, быть обратимым - вы должны быть в состоянии работать в обратном направлении от целевого языка исходного языка на практике,. Есть несколько уловов, которые этого не происходило, а также он может - но архитектура действительно по крайней мере, сделать жизнь проще для разработчиков программного обеспечения пытаются производить совпадающие пары программ. Цунами (с английского на японский) и Тайфун японского на английский), например, доля большую часть своего базового программного кода.
12. Будучи с самого начала разрабатывались для использования на персональном компьютере, а не мощной рабочей станции или даже универсальный, цунами и использования Тайфун памяти очень эффективно. В результате, они ослепительно быстр на последних ПК - Продам в любом случае со скоростью более 300 000 слов в час. Они производят широкий диапазон переводы по щелчку мыши? Не на долго выстрел. Но они придумали на удивление хорошо первых проектов для экспертов переводчики, чтобы получить свои зубы в.
Одна ошибка, что ранние исследователи сделали было себе представить, что не меньше, чем безупречная, полностью автоматизированный машинный перевод не хватило бы. С более реалистичных ожиданий, машинный перевод, наконец, начинает оживать.
переводится, пожалуйста, подождите..