ОСНОВНАЯ  | ПОМОЩЬ | ПРЕССА | КЛИЕНТЫ | СВЯЗЬ | СКАЧАТЬ | ВИДЕО | АРМЯНСКАЯ ВЕРСИЯ

 Реалии армянского языка

или

Что такое 2011 версия

 

Статья на русском языке,
рассчитана на тех, у кого русское образование.

 

 

Итак, хотелось бы провести обзор итога проделанной работы. Над проектом PowerSpell 2011 работают 5 человек, а сам проект в процессе развития и его задача решить вопрос смыслового анализа текста. Во-первых, стоит отметить, что именно успешные продажи 2009 года позволили нам осуществить инвестиции на разработку новой версии. Успех 2009 был феноменальным, мы сами не ожидали, что программу будут покупать буквально со всего света, в списке уже более 10 стран, где используется версия 2009. Именно поэтому такой мощный инструмент предоставляется бесплатно всем пользователям предыдущей версии, так сказать, в качестве благодарности за поддержку лицензий и уважения авторского права.

 

2011 версию можно смело назвать прорывом, так как для электронной поддержки армянского языка впервые были проведены исследования на таком серьезном уровне реалий именно нашей повседневной жизни. Таким образом, 2011 версия больше не программа для проверки орфографии, теперь это электронный корректор текстов, который решает комплекс задач, выходящий далеко за пределы так называемых “спелл чекеров”.

 

Накопленные данные

 

На нашем сервере скопилась статистика ошибок более чем миллиона страниц текстов из 2009 версии. Это уже само по себе уникальное исследование реалий армянского языка, подобные отчеты никогда и никем не собирались, и вот хотелось, был для начала сказать, о чем идет речь.

 

Результаты исследований

 

Проблема реалий жизни 1. Реалии таковы, что в армянском языке в массовом порядке применяются слова, взятые из русского и английского языков, формально таких слов в армянском языке не существует, но они упорно употребляются, просто потому, что они реально удобны, а армянский аналог этого слова многие могут просто не понять. А что значит, что слова в языке нет - это значит, что каждый его пишет как угодно, по-своему. Возьмем слово ստատիստիկա, кто-то его пишет через Թ Տ, но в армянском языке есть слово վիճակագրություն, другой пример слово ժուռնալիստիկա, դեդուկցիա, ունիֆիկացիա, մարկետինգ, ստատուս, ունիկալ, տակտիկա,  մառազմ, դեբիլիզմ, աֆերիստություն, пишут по-разному, кто как хочет, главное чтобы смысл был понятен.

В прошлой версии для подобных случаев мы предлагали армянские варианты слов, но там было внедрено всего 200 случаев, и то только определенного вида написания. В итоге люди просто добавляли это слова в словарь, таким образом, упорно утверждая, что слова удобны, а значит, будут применяться.

 

Решение 1. Мы решили не менять реалий жизни, а просто улучшить их, наша программа для наших людей, а значит что удобно им, то хорошо для нас. Теперь наша программа будет не только предлагать армянские варианты, но и не забывать проверять хотя бы правильность написания русских и английских слов написанных на армянский манер. Мы создали уникальный словарь “реально употребляемых иноязычных слов”, таким образом, программа будет следить, чтобы эти слова писались хотя бы грамотно и одинаково на армянский манер, включая склонения этих слов. В основу грамотности закладывается правописание слова из его оригинального языка, т.е. если слово английское, то значит, что в армянском языке будет буква Թ вместо Տ и т.д.

 

Проблема реалий жизни 2: Многие люди просто не знают наш язык, у большинства еще и русское образование, которое я считаю одним из лучших в мире. Не зная армянский язык, люди пишут тексты на нем каждый день, он довольно богат, но с его правилами, которые мы еще в школе проходили многие не очень дружат. Например, многие не знают, зачем и когда надо ставить символ пояснения (Бут), запятую и т.д., неправильно склоняют слова, просто потому, что не знают, как оно склоняется.  Еще одна довольно грубая ошибка, ставшая фактически стандартом языка, идет перечисление чего-либо, например функций некоторой программы, после каждого перечисления ставят символ: и дают пояснение в виде отдельного предложения. В итоге читается это все как незавершенные предложение, тогда как, символ: нельзя ставить в списках, после которых идет его пояснение, ставится Бут.  Разумеется, 2009 версия полностью игнорировала подобные ошибки.

 

Решение проблемы: Система обучающих напоминаний, наподобие учебника, появляется в виде маленького желтого окна на экране, где объясняет, почему в данном случае или когда должна быть запятая или бут, или почему нельзя здесь ставить символ: и т.д. Многие, таким образом, могут выучить, то, что забыли еще в школе.

 

Проблема реалий жизни 3:  Раздельное написание слов, писать которые раздельно считается грубой ошибкой.  Например: մինչ դեռ, նույն իսկ, այն ու ամենայնիվ и т.д. Подобные факты фактически массовое явление, при этом 2009 версия не обращала на это внимание, так как при разделении получаются новые, вполне правильные по раздельности слова.

 

Решение проблемы: Слова проверяются теперь по 3, т.е. каждые 3 слова рассматривается как одна связка, это значит что подобные случаи, как и неправильные связи автоматически выявляются, хороший способ выучить армянский язык.

 

Проблема реалий жизни 4:  Забытые слова в предложении.

 

Решение проблемы: Не знаю, то ли все печатают быстро и думают быстро, то ли просто не знают, что забывать в предложении слово, значит убить это предложение – явление массовое, фактически стандартное. Задача сложнейшая по уровню анализа, решается лишь частично 2011 версией, которая воспринимает подобные случаи как “трудно понимаемое предложение”.  Между тем, выявляются таким способом уникальные случаи ошибок, которые никак по-другому не обнаружить.

 

Проблема реалий жизни 5:
Термины.
Терминов очень много, но многие из них официально не существуют в армянском языке.

 

Решение проблемы.

Нам удалось собрать и стандартизировать около 5000 таких терминов из разных областей науки, экономики, математики, медицины. Так, например “драйвер”, официально его нет, есть слово варич, применять которое как термин для драйверов устройств многие по целому ряду вполне оправданных соображений отказываются, то же самое касается слова “կնախտաբան” – гинеколог, это слово упорно игнорируется, да и не буду комментировать почемуJ

 

 

Проблема реалий жизни 6:  Правильные” ошибки

Правильная ошибка – это когда, в результате обычной опечатки, получается правильное слово, не нарушая грамматику предложения. В итоге мы можем в тексте центрального банка, вместо выражения Կենտրոնական Բանկ  встретить  Կենտրոնական Բան или Կենտրոնական Բանտ:  Слишком много таких слов в армянском языке, одна опечатка и, в итоге, другое приемлемое слово: Другой пример - այդ իսկ պատառով, вполне приемлемое выражение, но в основном имеется ввиду այդ իսկ պատճառով:

 

Решение проблемы: Возможность ввода собственных правил для словосочетаний, когда дается строгое соответствие одного слова другому, подобные правила могут быть специфичными для текстов данного предприятия или фирмы, именно поэтому эта возможность предоставлена пользователям.

 

Грамматика

 

500 случаев грамматики и пунктуации, на понятном языке означает везде, кроме смысловых случаев, но анализ предложения на смысловом уровне это уже дело техники, не более того, задача будет решена на 50% в следующем году.  У предыдущей версии было 50 случаев анализа простейшей грамматики.

 

Статистика


Среди тех, кто набирает армянские тексты, почти у половины русское образование, к такому выводу мы пришли, проанализировав 2,000,000 ошибок встречаемых в текстах.

Дело в том, что у людей с русским образованием специфические ошибки - никогда не употребляются бут, и практически всегда идет неправильное склонение слова, которое сокращается при склонении.

Именно поэтому мы планируем ввести в оборот русскую версию программы, где все подсказки и пояснения будут на русском языке.

 

Удобно или официально

 

Есть то, что удобно для людей и именно поэтому применятся, есть то, что официально.

Практика показала, люди употребляют только то, что удобно и не более того. 2009 версия буквально гналась за тем, что официально, в итоге люди просто добавляли удобные слова в словарь. Теперь подход обратный, мы хотим, чтобы людям было удобно, не забывая про официальность тоже.

 

Армянские фамилии

 

У нас скопилась уникальная база армянских фамилий, которые наиболее часто встречаются в текстах, это более 2000 фамилий, тоже не маловажное исследование для реалий жизни.

 

Итог


В итоге 2011 версия -  это инструмент, адаптированный к реалиям жизни, удобный, который справляется со сложнейшей задачей – никакой текст, написанный совершенно безграмотно и без знаков препинания, программа превращает в вполне нормальный, читабельный текст, не забывая при этом с помощью подсказок учить армянскому языку обывателя, у которого, скорее всего, русское образование.

Программа больше не навязчива, и не настаивает на своем, наоборот, все приводится в дружелюбном виде - перепроверить и убедиться, что все правильно.

 

 

 

 

Спасибо порталу novosti2020.com за информационную поддержку

(c) 2000-2010 by Arman Boshyan. Tel: +37410 566 288 e-mail: powerspell@gmail.com