Библиотека knigago >> Наука, Образование: прочее >> Языкознание >> Прикладное программное обеспечение: системы автоматической обработки текстов


СЛУЧАЙНЫЙ КОММЕНТАРИЙ

# 1163, книга: Афон и его судьба
автор: Владислав Альбинович Маевский

Ох, скажу я вам, книга "Афон и его судьба" Владислава Маевского - это кладезь мудрости и благодати! Паломничество на Святую Гору оставило глубокий след в моей душе, и эта книга словно снова перенесла меня туда. Автор мастерски вплетает личные впечатления с историческими фактами и глубоким пониманием христианских ценностей. Маевский в увлекательной манере описывает красоту и святость Афона, его монастыри и традиции, проливая свет на его духовное значение. Я особенно восхищен его...

Михаил Георгиевич Мальковский , Татьяна Юрьевна Грацианова , И Н Полякова - Прикладное программное обеспечение: системы автоматической обработки текстов

Прикладное программное обеспечение: системы автоматической обработки текстов
Книга - Прикладное программное обеспечение: системы автоматической обработки текстов.  Михаил Георгиевич Мальковский , Татьяна Юрьевна Грацианова , И Н Полякова  - прочитать полностью в библиотеке КнигаГо
Название:
Прикладное программное обеспечение: системы автоматической обработки текстов
Михаил Георгиевич Мальковский , Татьяна Юрьевна Грацианова , И Н Полякова

Жанр:

Языкознание, Интернет

Изадано в серии:

неизвестно

Издательство:

Издательство МАКС "Пресс"; Издательский отдел факультета вычислительной математики и кибернетики МГУ им. М.В. Ломоносова

Год издания:

ISBN:

5-89407-086-4

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Прикладное программное обеспечение: системы автоматической обработки текстов"

Учебное пособие знакомит читателей с одной из наиболее интересных и перспективных задач прикладного программирования - задачей автоматической обработки тестов на естественном языке. Рассмитриваются рациональные сферы применения систме автоматической обработки текстов , проблемы их линвистиеского обеспечения.
Для студентов 2 курса факультета ВМК МГУ в поддержку обязательного лекционного курса "Прикладное программное обеспчение".
Авторы пособия благодарят Владимира Геннадиевича Абрамова и Валерия Ивановича Родина за ценные советы и замечания.

Рецензенты: проф. Р.Л. Смелянский, доц. Л.С. Корухова.

Печатается по решению Редакционно-издательского совета факультета вычислительной математики и кибернетики МГУ им. М.В. Ломоносова.

Читаем онлайн "Прикладное программное обеспечение: системы автоматической обработки текстов". [Страница - 2]

работы одной из современных коммерческих систем перевода. Предложим ей перевести народное английское стихотворение, известное нам в переводе "Робин-Бобин" (текст этот очень простой, московские дети изучают его в начальной школе):

Robin, Robin, what a man!

He eats as much as no one can.

He ate a lot of fish, he ate a lot of meat.

He ate a lot of ice-cream and a sweet.

He ate a lot of porridge and ten eggs

And all the cookies Mother had.

He drank a lot of juice, he ate a cake

Then said: "I have a stomach-ache"

Малиновка, Малиновка, какой человек!

Он ест насколько никто не может.

Он съел много рыб, он съел много мяс.

Он съел много ледяных-сливки и сладкий.

Он съел много каша и десять яйцо

И вся Мать повары имела.

Он пил много соков, он съел торт

Затем сказал: "У меня есть желудок- боль"

Сравним с художественным переводом К.Чуковского:

Робин Бобин Барабек

Скушал сорок человек.

И корову, и быка,

И кривого мясника,

И телегу, и дугу,

И метлу, и кочергу.

Скушал церковь, скушал дом,

И кузницу с кузнецом,

А потом и говорит:

– У меня живот болит!

Следующий пример показывает неустойчивость системы машинного перевода при обработке неоднозначностей. Два предложения по отдельности "Flyer flies." и "Flyers fly." переводятся "Летчик летает." и "Летчики летают.", если же из тех же словосочетаний составить одно предложение "Flyer flies and flyers fly" получаем "Летчик летает и муха летчиков.".

Конечно, системы, настроенные на определенную предметную область, дают гораздо более приемлемые результаты. Однако в этом случае системы перевода получаются очень узко ориентированными, и попытка использовать их даже в смежных предметных областях дает совершенно непредсказуемые результаты. Подобные эксперименты даже распространены среди любителей пошутить: инструкция по эксплуатации манипулятора-мыши, переведенная с английского языка на русский системой автоматического перевода, использующей специализированный медицинский словарь, превращается в описание всевозможных издевательств над несчастным маленьким грызуном.

Возникают эти проблемы из-за принципиально разных подходов к переводу человека и машины. Квалифицированный переводчик понимает смысл текста и пересказывает его на другом языке словами и стилем, максимально близкими к оригиналу. Для компьютера этот путь выливается в решение двух задач: 1) перевод текста в некоторое внутреннее семантическое представление и 2) генерация по этому представлению текста на другом языке. Поскольку не только не решена сама по себе ни одна из этих задач, а нет даже общепринятой концепции семантического представления текстов, при автоматическом переводе приходится фактически делать "подстрочник", заменяя по отдельности слова одного языка на слова другого и пытаясь после этого придать получившемуся предложению некоторую синтаксическую согласованность. Смысл при этом может быть искажен или безвозвратно утерян.

Более реалистичными являются попытки создать системы автоматизированного перевода - программы, которые не берут на себя полностью весь перевод, а лишь помогают человеку-переводчику справиться с некоторыми трудностями (Computer Aided Translation). Одним из примеров таких систем является Eurolang Optimizer. Его можно рассматривать как нечто переходное между компьютерным словарем и программой-переводчиком, как некий набор предметно-ориентированных глоссариев, снабженный интерфейсом для удобства переводчика: предлагается несколько вариантов перевода, выделенные разными цветами в зависимости от условий применимости; переводчик может с помощью меню определенным образом настраивать словари для более быстрого и правильного выбора нужного эквивалента.

Подобные программные средства могут помочь в решении проблем, связанных с терминологией и вообще со знаниями переводчика о предметной области: одни и те же слова могут по-разному переводиться в зависимости от того, о каком предмете идет речь.

Автоматически может быть решена проблема согласованности. Понятно, что согласованность важна в рамках одного документа: один и тот же термин, даже если его без потери смысла можно перевести несколькими словосочетаниями, должен переводиться одинаково на протяжении всего документа. Однако еще более важной является согласованность в широком смысле - разработка и применение единой концепции интерпретации одного и того же термина на разных языках (скажем, американский разработчик программного обеспечения может быть --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.