Пентагон хвастает прорывом в компьютерном переводе
Сообщений: 16
• Страница 1 из 2 • 1, 2
Пентагон приступил к созданию системы, которая позволит обеспечить войска мгновенным и адекватным переводом речи на разных языках в боевых условиях. Языки «вероятного противника», наряду с английским, – китайский и арабский.
Пентагон создает суперкомпьютер, который позволит из огромных массивов перехваченных разговоров и обменов данными на самых разных языках мира вычленять информацию, которая может иметь отношение к шпионажу против США, и тут же переводить ее на английский. По мнению экспертов, данный проект в области лингвистики не имеет прецедентов.
Агентство передовых оборонных проектов США DARPA выделило на это сумму, оцениваемую в $50 млн. на ближайшие два года. Согласно имеющейся информации, контракты на разработку оборудования получили компании IBM, SRI и BBN. Тем не менее, официальный представитель DARPA отказалась подтвердить информацию и о сумме контрактов, и об участвующих в работах компаниях.
Если усилия разработчиков увенчаются успехом, машина впервые сможет не просто распознавать речь, произносимую на различных языках, но и тут же корректно переводить ее на английский, а затем самостоятельно вычленять из «мусора» информацию, свидетельствующую о скрытом шпионаже или иной противоправной деятельности.
Проект получил название GALE (Global Autonomous Language Exploitation, глобальная система автоматической обработки языков), которое подчеркивает значимость и цель — превращение циклопических объемов данных в виде записей разговоров на разных языках, телефонных переговоров, интернет-сообщений и т.д. в обработанную информацию, пригодную для использования аналитиками спецслужб, шпионах и войсками на поле боя.
В настоящее время, сообщает Red Herring, США рассматривают в качестве одного из основных препятствий с борьбе с исламским терроризмом и в войнах в арабских странах вообще невозможность в сколь-нибудь разумные сроки «разгрести» и быстро перевести те чудовищные объемы информации, которые удается получить.
"По мнению DARPA, проект GALE способен стать «Святым Граалем» лингвистических технологий, полагает Джон Макгоул (John Makhoul), сотрудник компании BBC, принимающий участие в работах по проекту GALE. В настоящее время, по его словам, лучшие программы распознавания речи при работе в конкретной среде, такой, как телевизионное вещание, позволяют правильно определять девять слов из десяти. DARPA хочет добиться 95% успешного перевода. Кроме того, программа должна обрабатывать радиовещание, телевидение, диалоги в ток-шоу, новостные сообщения и информацию из новостных выпусков, сетевых дневников, а также телефонных переговоров. Языки «вероятного противника» — английский, китайский и арабский. В настоящее время, по мнению экспертов, точность перевода текста системами автоматического перевода составляет около 80%.
В настоящее время ПО для распознавания текста и автоматического перевода уже используется — в частности, в системах обработки вызовов и в ряде межнациональных корпораций. Пентагон хочет, чтобы проект GALE позволил бы «вывести» эти системы из просторных кондиционированных помещений, создав неприхотливую систему, пригодную к быстрому развертыванию в полевых условиях.
Пентагон создает суперкомпьютер, который позволит из огромных массивов перехваченных разговоров и обменов данными на самых разных языках мира вычленять информацию, которая может иметь отношение к шпионажу против США, и тут же переводить ее на английский. По мнению экспертов, данный проект в области лингвистики не имеет прецедентов.
Агентство передовых оборонных проектов США DARPA выделило на это сумму, оцениваемую в $50 млн. на ближайшие два года. Согласно имеющейся информации, контракты на разработку оборудования получили компании IBM, SRI и BBN. Тем не менее, официальный представитель DARPA отказалась подтвердить информацию и о сумме контрактов, и об участвующих в работах компаниях.
Если усилия разработчиков увенчаются успехом, машина впервые сможет не просто распознавать речь, произносимую на различных языках, но и тут же корректно переводить ее на английский, а затем самостоятельно вычленять из «мусора» информацию, свидетельствующую о скрытом шпионаже или иной противоправной деятельности.
Проект получил название GALE (Global Autonomous Language Exploitation, глобальная система автоматической обработки языков), которое подчеркивает значимость и цель — превращение циклопических объемов данных в виде записей разговоров на разных языках, телефонных переговоров, интернет-сообщений и т.д. в обработанную информацию, пригодную для использования аналитиками спецслужб, шпионах и войсками на поле боя.
В настоящее время, сообщает Red Herring, США рассматривают в качестве одного из основных препятствий с борьбе с исламским терроризмом и в войнах в арабских странах вообще невозможность в сколь-нибудь разумные сроки «разгрести» и быстро перевести те чудовищные объемы информации, которые удается получить.
"По мнению DARPA, проект GALE способен стать «Святым Граалем» лингвистических технологий, полагает Джон Макгоул (John Makhoul), сотрудник компании BBC, принимающий участие в работах по проекту GALE. В настоящее время, по его словам, лучшие программы распознавания речи при работе в конкретной среде, такой, как телевизионное вещание, позволяют правильно определять девять слов из десяти. DARPA хочет добиться 95% успешного перевода. Кроме того, программа должна обрабатывать радиовещание, телевидение, диалоги в ток-шоу, новостные сообщения и информацию из новостных выпусков, сетевых дневников, а также телефонных переговоров. Языки «вероятного противника» — английский, китайский и арабский. В настоящее время, по мнению экспертов, точность перевода текста системами автоматического перевода составляет около 80%.
В настоящее время ПО для распознавания текста и автоматического перевода уже используется — в частности, в системах обработки вызовов и в ряде межнациональных корпораций. Пентагон хочет, чтобы проект GALE позволил бы «вывести» эти системы из просторных кондиционированных помещений, создав неприхотливую систему, пригодную к быстрому развертыванию в полевых условиях.
[quote=KriG,Aug 5 2005, 03:15 PM]А ты откуда знаешь??
[/quote]
Изучал немного. Причем раздел АИ, связанный именно с сабжем - Анализ текста. В применении современных методик можно эффективно искать нужную инфу в инете, распознавать тексты. НО не переводить. Например Файн ридер - это детство по сравнению с тем, что может некомерческая система. Но вот переводчики типа промта довольно наглядно показывают возможности современной науки (некомерческие лучше, но искусственного разума не существует на данный момент)
[/quote]
Изучал немного. Причем раздел АИ, связанный именно с сабжем - Анализ текста. В применении современных методик можно эффективно искать нужную инфу в инете, распознавать тексты. НО не переводить. Например Файн ридер - это детство по сравнению с тем, что может некомерческая система. Но вот переводчики типа промта довольно наглядно показывают возможности современной науки (некомерческие лучше, но искусственного разума не существует на данный момент)
[quote=Kent,Aug 5 2005, 04:05 PM]Изучал немного
[/quote]
предстоит изучать в следующем году, вот тогда и поговорим
попробуй доказать это преподу информатики одного из омский колледжей (название не помню)
она преподает студентам то что сейчас пятое поколение ЭВМ
ЗЫЖ для тех кто в БМП: пятое поколение ЭВМ характеризуется наличием искуственного интеллекта, а сейчас используется только четвертое.GIF)
[/quote]
предстоит изучать в следующем году, вот тогда и поговорим
но искусственного разума не существует на данный момент
попробуй доказать это преподу информатики одного из омский колледжей (название не помню)

ЗЫЖ для тех кто в БМП: пятое поколение ЭВМ характеризуется наличием искуственного интеллекта, а сейчас используется только четвертое
Сообщений: 16
• Страница 1 из 2 • 1, 2
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6