![]()
Автоматизи́рованный перево́д (АП, англ. Computer-Aided Translation ) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством. [ источник не указан 597 дней ]
Содержание
Содержание
История [ править | править код ]
Одним из пионеров идеи автоматизированного перевода является советский учёный Пётр Петрович Троянский, предложивший в 1933 году «машину для подбора и печатания слов при переводе с одного языка на другой». Машина состояла из стола с наклонной поверхностью, перед которым был закреплён фотоаппарат, синхронизированный с печатной машинкой. На поверхности стола располагалось «глоссарное поле» — свободно двигающаяся пластина с напечатанными на ней словами на трёх, четырёх и более языках [1] .
Практическая реализация идеи автоматизированного перевода началась с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам.
В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom [2] . В Советском Союзе для создания баз такого рода был создан ВИНИТИ.
В современной форме идея АП была развита в статье Мартина Кея 1980 года [3] , который выдвинул следующий тезис: «By taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» («Компьютер берёт на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления»).
В настоящее время наиболее распространённые способы использования компьютеров при письменном переводе — работа со словарями и глоссариями, памятью переводов (англ. Translation Memory, TM ), содержащей примеры ранее переведённых текстов, терминологическими базами, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что даёт сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.
Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например Aegisub, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможности появления субтитров по времени, их форматирования на экране, следования видеостандартам и т. п.
При синхронном переводе использование средств автоматизированного перевода из-за его специфики ограничено. Одним из примеров является использование словарей, загружаемых на КПК. Другим примером может служить полуавтоматическое извлечение списков терминов при подготовке к синхронному переводу в узкой предметной области [4] .
В узких предметных областях при большом количестве исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тексты и текущая корреспонденция) переводится с использованием МП.
Общий обзор [ править | править код ]
Автоматизированный перевод — это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:
- Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;
- Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;
- Программы для управления терминологией, которые позволяют переводчикам управлять своей собственной терминологической базой в электронной форме. Это может быть и простая таблица, созданная в текстовом редакторе, и электронная таблица, и база данных, созданная в программе FileMaker. Для более трудоёмких (и более дорогих) решений существует специальное программное обеспечение, например LogiTerm, MultiTerm, Termex, TermStar и т. п.
- Словари на компакт-дисках, одноязычные или многоязычные;
- Терминологическиебазы данных, хранимые на компакт-дисках или подключаемые по Интернету, например The Open Terminology Forum или TERMIUM;
- Программы для полнотекстового поиска (или индексаторы), которые позволяют пользователю обращаться с запросами к ранее переведённым текстам или разного рода справочным документам. В индустрии переводов известны такие индексаторы, как Naturel, ISYS Search Software и dtSearch;
- Программы конкорданса, позволяющие находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как битекст или память переводов, например Transit NXT;
- Битекст, одно из нововведений последнего времени, это результат слияния исходного текста и его перевода, который впоследствии может быть проанализирован при помощи программ для полнотекстового поиска или конкорданса;
- Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты, передавать выполнение различных задач разным сотрудникам и наблюдать за процессом выполнения этих задач;
- Программы управления памятью переводов (TMM), состоящие из базы данных сегментов текста на исходном языке и их переводов на один или более целевых языков, например Transit NXT;
- Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определённые изменения в сомнительных случаях. Иногда такие программы называют машинным переводом с участием человека.
Коты – животные непростые, и хотя самым продвинутым спикером среди них считается Чеширский кот, наш Васька из Лукоморья сказки говорит не хуже британца. В этом посте мы расскажем вам о том, как мы выбирали CAT (Computer-Aided Translation — систему автоматизированного перевода) для синхроподкастов, какую выбрали и почему.
Сколько ни штудируй английскую грамматику, ни зубри слова, а понимать английскую речь на слух это не поможет. Чтобы научиться ловить смысл сказанного надо слушать, слушать и еще раз слушать английскую речь. Именно поэтому в конце 2017 мы выпустили новый продукт — синхроподкасты — обучающие ролики с видео, аудио и синхронизированным текстом.
Синхронные подкасты позволяют одновременно слушать английскую речь (текст читается очень разборчиво, в медленном темпе), видеть соответствующие события на экране и читать перевод текущего фрагмента речи.
Создание синхроподкастов — процесс сложный, но благодаря тому, что материал должен отвечать привычной учебной форме (типичные тембры, четкая артикуляция, произношение, близкое к эталонному), здесь удается применять технологию автоматизированного перевода. Для тех, кто не в теме: автоматизированный перевод и машинный перевод — это не одно и то же. Термином «машинный перевод» называют действие, когда текст переводится с одного естественного языка на другой с использованием специального программного обеспечения. Автоматизированный перевод отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.
Какие CAT-системы мы анализировали при выборе
Приступая к созданию синхроподкастов, мы, конечно, обозрели широкий арсенал систем САТ. Если вы попробуете поискать такие программы в Гугле или Яндексе, то одной из первых в списке будет CAT-система Deja Vu.
Deja Vu. Это очень простая программа, без нагромождений и лишнего функционала, разработанная испанской компанией Atril Language Engineering, специализирующейся на разработке компьютерных систем для автоматизации работы переводчиков и переводческих агентств. Но и возможностей у нее не очень много. Достоинство – занимает мало места на компьютере.
Deja Vu X может создавать проекты и работать с форматами Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII.
Версия Deja Vu Х Standard рассчитана на переводчиков-фрилансеров, желающих иметь простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.
Целевая группа профессиональной версии — те же переводчики-фрилансеры. Но Déjà Vu Professional уже обладает такими автоматизированными функциями, как предперевод, автопоиск по базам данных, автоподстановка перевода по всем аналогичным сегментам на проекте, автопополнение баз данных, а также автосборка перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.
Для агентств и отделов переводов выпущена версия Deja Vu Workgroup. Это достаточно мощный инструмент, включающий все функции версии Professional, и дополненный функционалом для организации коллективной работы, управлению проектами и интеграции.
Deja Vu X TeaM Server – еще более продвинутая система, дает возможность пользователям Deja Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Обеспечивает единообразие и производительность, уменьшает проектные затраты. Разные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.
MemoQ — еще одна широко распространенная CAT-система. Ее любят локализаторы, поскольку в отличие от других она совместима с файлами Excel. В MemoQ можно загружать разные типы файлов, и она не привередлива к их объему и содержанию. Но у нее непривычный функционал, и многие пользователи, имеющие опыт работы с другими системами, на первых порах испытывают трудности в настройке.
MultiTerm — программа, которую переводчики используют для создания базы переводов, популярна в узкоспециализированных сообществах, которые занимаются переводами текстов по определенным тематикам. Одно из достоинств MultiTerm — возможность создавать глоссарии для использования в CAT-системах, которые впоследствии вручную можно подключить к автоматизированным системам. Но есть и недостатки. Программа не отличается дружественным интерфейсом, и новичкам довольно сложно разобраться в настройках.
Across — также достаточно популярная система с простым интерфейсом. Но отношение к ней неоднозначно. Все дело в «прозрачности»: проектные данные находятся в открытом доступе. Такой системой можно пользоваться, если вопрос о защите данных не актуален.
XTM — сложная система, используемая крупными компаниями в промышленных целях. Рассчитана на масштабные проекты и большие объемы данных. Главное — суметь правильно ее настроить. Тогда пользователям будет удобно с ней работать, они сэкономят массу времени. А вот переводчикам эта программа вряд ли подойдет.
TRADOS. Все перечисленные выше системы по тем или иным параметрам уступают яркому лидеру среди коммерческих систем – Trados. Этот продукт разработан немецкой компанией Trados GmbH, и является одним из мировых лидеров в данном классе. У системы огромное количество достоинств. Среди ключевых — на данный момент Trados поддерживает 93 языка (больше, чем все остальные системы). И по объему базы памяти переводов она лучше всех известных нам систем. Из недостатков можно отметить специфичный интерфейс. Впрочем, удобство интерфейса – дело вкуса и привычки. Есть проблемы с поддержкой некоторых форматов. Она привередлива к объему и типу файлов (например, уступает по этому параметру MemoQ). И Trados совсем не умеет извлекать текст из картинок.
SmartCAT. Это бесплатная облачная браузерная среда, обеспечивающая совместную работу целой команды переводчиков. Разумеется, SmartCAT — не первая в своем классе. Но по многим параметрам она опережает аналоги, как платные, так и бесплатные. Почему так получилось, становится понятно, если мы поинтересуемся происхождением этой системы. Изначально разработчиком SmartCAT была компания ABBYY, она-то и заложила в продукте широкие функциональные возможности. Сегодня Smartcat — самостоятельная фирма.
Почему мы выбрали SmartCAT
Рассмотрим подробнее функционал системы. Ее главный козырь – многочисленные лингвистические ресурсы, облегчающие работу переводчиков с однотипными текстами, содержащими стандартные фразы и предложения. Как правило, это общепринятые термины — технические, юридические, экономические, научные и т.д., описания товаров и услуг, деловая документация и многое другое. Тут ключевую роль играют базы Translation Memory — базы памяти переводов. В них хранятся когда-то переведенные тексты. Понятно, что эти базы постоянно пополняются новыми переводами.
Другой важный ресурс — глоссарии, которые содержат термины и понятия, принятые в какой-то конкретной отрасли, или компании. SmartCAT позволяет накапливать и поддерживать в актуальном состоянии корпоративные глоссарии и обеспечивает исполнителей правильными данными. А автоматические проверки гарантируют контроль качества перевода, обнаруживая несоответствия в терминах и датах, и отмечая орфографические, пунктуационные и другие ошибки.
Само собой, SmartCAT способна также выполнять и машинный перевод.
Указанные ресурсы системы облегчают работу человека, использующего CAT. Система предлагает варианты перевода отдельных фрагментов, опираясь на имеющиеся тексты из баз памяти переводов и глоссарии с корпоративной терминологией. Переводчик может просто воспользоваться предложенным вариантом, либо отредактировать его, либо, в крайнем случае, перевести текст по собственному разумению.
Особо следует остановиться на форматах файлов, поддерживаемых системой SmartCAT. Их список весьма внушителен: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls, ppt, pptx, potx, pps, ppsx, odp, ttx, sdlxliff, xlf, xliff, srt. Обращает внимание то, что в приведенном списке немало графических форматов. Это приятное наследие ABBYY. Нередко переводчикам приходится работать с документами не в виде текста, а в виде изображений. Чтобы извлечь текст, его необходимо сначала распознать. SmartCAT интегрирован с OCR-технологиями ABBYY: достаточно загрузить графический файл, и система извлечет текст для перевода. Если вам хоть раз приходилось вручную вбивать текст, глядя на картинку, вы по достоинству оцените прелесть использования OCR-технологии.
Еще один комплимент от ABBYY — возможность использования словарей Lingvo. Небольшое, но все же удобство, когда все необходимое для перевода у вас под рукой.
Когда в описании системы встречаются слова «облачная среда», многие потенциальные пользователи рефлекторно напрягаются: «А как обстоят дела с безопасностью? Не украдут ли мои данные?» Ответим честно: взломать можно что угодно. Просто целесообразность взлома определяется соотношением затраченных времени и сил, и полученным результатом. В системе SmartCAT данные хранятся в дата-центре уровня Tier 4 и передаются по защищенным каналам, а уровень доступа к материалам регулируется с помощью системы распределения прав.
Заканчивая краткое описание SmartCAT, добавим, что интерфейс системы интуитивно понятен любому, кто когда-либо работал с CAT-инструментами: вы увидите на привычном месте оригинальный текст и перевод, окно совпадений с памятью переводов и глоссарием. Имеется отдельное окно для поиска в памяти, глоссариях и словарях, и еще одно окно — для результатов проверки качества, истории изменений фрагмента текста и комментариев.
Ну и еще несколько функций и особенностей, которые нельзя обойти молчанием
Итого
Хорошенько проанализировав весь арсенал достойных внимания систем САТ, в финале мы выбирали из двух: Trados и SmartCAT. Сравнение их функциональных возможностей показало, что примерно на 95% (это субъективная оценка автора) данные системы идентичны. С одной стороны, большее число поддерживаемых языков и больший объем базы памяти переводов Trados, с другой, дружелюбный интерфейс, поддержка графических форматов и способность извлекать текст из изображений, меньшая требовательность к объему файлов, масса полезных дополнительных функций и бесплатность SmartCAT.
В итоге мы выбрали SmartCAT. И хотя британец Тrados (сегодня система принадлежит британской компании SDL International) хорош и в моде, российская система CAT по ряду параметров превосходит зарубежный аналог и при этом проста в использовании, удобна и не капризна.
Константин Геращенко, редактор образовательного онлайн-ресурса Puzzle English
Для удобства работы с переводами, переводчики-фрилансеры и компании используют Cat tool, или CAT программу, которая отлично подходит для организации переводческой работы в офисах компаний. Это по сути комплексное решение по автоматизации переводов, которое имеет набор полезных функций и удобно для использования.
О CAT программе
Cat tool (Computer-assisted translation tool) – это современное комплексное решение для переводчиков и компаний, которые занимаются профессиональными переводами. Основная задача CAT инструмента – сократить время на перевод документа за счет машинного перевода, подставления готовых частей перевода из памяти переводов, автоматического перевода согласно глоссариям, автоматической проверки качества перевода и других инструментов автоматизации перевода. Cat tool так же позволяет использовать проверку правописания, грамматики, управлять терминами, использовать специфические словари, использовать базы данных терминов, индексаторы текста, совершать слияние перевода и исходного текста, управлять проектами, памятью переводов, и автоматизировать переводческий труд.
Работа программы построена очень просто и удобно. Cat программа предоставляет переводчикам инструменты для автоматизации, при этом оставляя за ними право принимать решения и свободно корректировать перевод. Это – главная особенность бесплатной Cat программы.
Преимущества Cat tool
О преимуществах этого типа программ больше написано на странице: https://ru.smartcat.ai/corp-features. Главная особенность, которой обладает бесплатная Cat программа – это комплексность. В одном продукте разработчики включают архивацию и хранение ваших переводов, определение контекста сегментов текста для скорейшего анализа, быстрый автоматический перевод, хранение терминов словарей и контроль качества (проверку правописания и грамматики).
В итоге, можно существенно улучшить качество перевода, используя анализ и проверку текста при помощи Cat tool. Вместе с тем, есть возможность быстрого и точного машинного перевода, который отвечает всем нормативам и гарантирует отменное качество переведённого текста. Возможности бесплатной Cat tool программы позволят повысить производительность труда переводчиков, автоматизировав максимальное количество операций.
Термины и словари в программе могут создаваться пользователем для определённых случаев, и позволяют более эффективно использовать CAT программу в своих целях. В CAT программе Smartcat можно использовать бесплатно и готовые словари ABBYY.
Проверка правописания в CAT программах позволяет найти ошибки и устранить их, чтобы они не попали в готовый текст, сдаваемый заказчику.
Программы рассчитаны на различных пользователей. Автоматизированные технологии одинаково хорошо зарекомендовали себя как у фрилансеров, так и у крупных компаний.
Бесплатная Cat программа сегодня – это технология, которая стремительно развивается, и предоставляет всё больше возможностей для автоматизации. К примеру, сегодня машинный перевод становится всё более качественным при использовании с большими массивами информации при наличии устоявшихся выражений. За реализацию данной технологии отвечает компонент управления памятью переводов.
Cat программа задействует по максимуму потенциал машинного перевода, и позволяет вам совершать переводы намного быстрее, чем вручную. Во многих программах для перевода есть встроенные инструменты, которые не только позволяют использовать словари для более точного подбора терминов, но и запоминать ваши варианты перевода тех или иных фраз, чтобы использовать их в дальнейшем. Все данные, которые собирает программа, используются исключительно с целью оптимизации и упрощения вашей работы, создания благоприятной рабочей среды. Cat программа не отправляет вашу информацию третьим лицам, и не делает её доступной для них.
Получайте свежие обновления и полезную информацию
Следите за обновлениями CAT программы Smartcat на нашем блоге, и вы узнаете больше о возможностях программ и особенностях работы с ними. Мы постоянно публикуем полезные статьи и обзоры как отдельных возможностей программ, так и обновлений, которые выходят.
Бесплатная Cat tool программа в каждой версии имеет ряд усовершенствований, и не все переводчики могут с ними быстро разобраться. Благодаря нашим обзорам, вы будете всегда в курсе всех фиксов, новых возможностей и дополнений. Разработчики постоянно следят за текущими запросами потребителей, и реагируют на все найденные ошибки. Cat программа — это инструмент, который нужно постоянно изучать, так как он всё время трансформируется. С нашим блогом процесс изучения пройдёт намного быстрее и проще.
Попробуйте Computer-assisted translation
Мы предлагаем вам уже сегодня прикоснуться к современным технологиям машинного перевода и убедиться в том, что бесплатная cat программа – это лучшее решение, которое существует сегодня. Мы предлагаем вам бесплатный пробный период на программу Smartcat с возможностью дальнейшего приобретения.
Для того, чтобы воспользоваться нашим предложением, вам достаточно зарегистрироваться на нашем сайте в соответствующем разделе, и начать использовать Computer-assisted translation уже сегодня. Идите в ногу со временем и доверяйте только современным технологиям перевода. Мы уверены, что Cat программа Smartcat станет для вас надёжной опорой в работе.






