Результаты (
русский) 2:
[копия]Скопировано!
Текст 2
Дар языков Трой Дрейер PC Magazine июля 2006
1. Шутки о бесполезности машинного перевода предостаточно. Центральное разведывательное управление, как говорят, потратил миллионы, пытаясь программировать компьютеры, чтобы перевести с русского на английский. Лучший ей удалось сделать, так что сказка идет, было превратить знаменитый-русский поговорку "Дух готов, но плоть слаба" в "Водка хороша, но мясо гнило". К сожалению, эта история является мифом. Но машинного перевода, безусловно, произвел свою долю Howlers. С первых дней, предметом страдает от завышенных требований и ожиданий невозможно.
2. Обман по-прежнему существует. Но японские исследователи, возможно, подстрекаемый языковой барьер, который часто кажется, разделить ученых и техников своей страны от тех, в остальной части мира, добились больших успехов в достижении цели надежного машинного перевода, а теперь их усилия имитируется в Запад.
3. До недавнего времени основными коммерческими пользователями программы перевода не было больших японских производителей. Они полагаются на машинный перевод для производства первоначальные проекты их английского инструкций и продаж материала. (Это может помочь объяснить недоумение многие западные потребители чувствуют, как они листать инструкции по их видеомагнитофонов.) Самая популярная программа для этого является EJ банк, который был разработан по Нобуаки Kamejima, затворника мастера программного обеспечения на Ай Laboratories в 38 Токио. Теперь, однако, больший рынок манит. Взрыв иностранных языков (особенно японских и немецких) в Интернете превращается машинного перевода в основной бизнес. Фракция веб-сайтов, размещенных на английском языке упал с 98% до 82% в течение последних трех лет, и эта тенденция еще вниз. Потребительские программное обеспечение, некоторые из них, написанной не-японских производителей программного обеспечения, в настоящее время становятся доступными для интерпретации этого электронного Бабеля к тем, кто не может читать его.
Вариации Enigma
4. Машины для перевода с одного языка на другой были впервые заговорили о в 1930 году. Ничего особенного не произошло, тем не менее, до 1940 года, когда американский математик называется Уоррен Уивер были заинтригованы тем, как англичане использовали свою новаторскую Colossus компьютер взломать военные коды шифрования, произведенные машинами Германии Enigma. В меморандуме к своему работодателю, Фонд Рокфеллера, Уивер писал: "У меня есть текст передо мной, которое написано на русском, но я собираюсь делать вид, что это действительно написаны на английском языке, и что он был закодирован в некоторых странно символы. Все что мне нужно сделать, это сдирать код для извлечения информации, содержащейся в тексте.
"5. Первые "переводы двигатели" были основаны на этой прямой, так называемой «трансформатор», захода на посадку. Входные приговоры исходного языка преобразуется непосредственно были в выходные предложениях целевом языке, используя простую форму анализа. Анализатор сделал грубую / анализ исходного предложения, разделив его на предмет, объект, глагол, и т.д. Источник слова заменяется целевых слов, выбранных из словаря, и порядок их переставить так, чтобы соответствовать правилам мишени язык.
6. Это звучит просто, но это не было. Проблема с подходом Уивер была обобщена лаконично по Иегошуа Бар-Гиллель, лингвиста и философа, который задумался, какие чувства машина сделает приговора "Перо в коробке" (пишущий инструмент находится в контейнере) и Приговор "Коробка в ручке" (контейнер в [играть] ручкой).
7. Люди решать такие неясности в одном из двух способов. Либо они отмечают, контекст предыдущих предложениях или они выводят значение в изоляции, зная определенные правила о реальном мире, в данном случае, что коробки больше, чем перьев (письменные принадлежности), но меньше, чем ручки (Манежи) и большие объекты не могут поместиться внутри меньшего размера. Компьютеры, доступные для Уивер и его ближайших преемников не мог бы удалось.
8. Но современные компьютеры, которые имеют больше вычислительной мощности засушливый больше памяти, может. Их двигатели перевод могут принять меньше прямой подход, используя то, что называется "лингвистические знания". Именно это, что позволило г-н Kamejima производить EJ банк, а также позволила NeocorTech Сан-Диего, чтобы придумать цунами и тайфуна - первое программное обеспечение на японском языке-перевод работать на стандарте (английской) версии Microsoft Windows , 39
9. переводчики лингвистический-знания иметь два комплекта грамматических правил, по одному на исходном языке и один для мишени. Они также имеют много информации о идиоматических различий между языками, чтобы остановить их делает глупые ошибки.
10. Первый набор грамматических правил используется анализатором для анализа входного предложение ("я прочитал" Экономист "каждую неделю"). Приговор будет решена в дерево, которое описывает структурную связь между компонентами приговор в ("Я" [теме], «прочитать» (глагол), "Экономист" (объект) и "каждую неделю" [Фраза модификации глагол). До сих пор, процесс, как у трансформатора двигателя Уивер стиле. Но тогда все становится сложнее. Вместо того чтобы работать с заранее подготовленной формуле, генератор (то есть, парсер в обратном) приводится в действие, чтобы создать структуру предложения на целевом языке. Это так с использованием словаря и сравнительной грамматики-набор правил, который описывает разницу между каждым компонентом предложения на исходном языке и его коллега в целевом языке. Таким образом, мост второго языка строится на глубоких структурных фондов.
11. Помимо того, что гораздо более точным, такие двигатели языково-знания должны, по идее, быть обратимым-вы должны быть в состоянии работать в обратном направлении от целевой языка на исходном языке. На практике существует несколько уловов, которые этого не происходило, а как может - но архитектура действительно по крайней мере, сделать жизнь проще для разработчиков программного обеспечения пытаются производить совпадающие пары программ. Цунами (с английского на японский) и Тайфун японского на английский), например, доля гораздо своей основной программный код.
12. Будучи разработан с начала для использования на персональном компьютере, а не мощной рабочей станции или даже мэйнфреймов, цунами и использование Тайфун памяти чрезвычайно эффективно. В результате, они ослепительно быстро на последней PCs- переводил либо путь со скоростью более чем 300.000 слов в час. Они производят широкий диапазон переводы по щелчку мыши? Отнюдь не. Но они придумали удивительно хороших первых проектов для экспертов переводчиков, чтобы получить свои зубы в. Одна ошибка, что ранние исследователи сделали было себе представить, что не меньше, чем безупречная, полностью автоматизированный машинный перевод не хватит. С более реалистичных ожиданий, машинный перевод, наконец, начинают процветать.
переводится, пожалуйста, подождите..