ОБОСНОВАНИЕ ПЕРЕВОДА АЛФАВИТА КАЗАХСКОГО ЯЗЫКА

НА ЛАТИНИЦУ

 

А. А. ШАРИПБАЙ

 

 

I. Актуальность.

В своей программной статье  «Ориентир на будущее: духовное обновление» Президент Казахстана Н.А. Назарбаев предложил Проект перехода на латинский алфавит: «...мы должны начинать работы по постепенному переводу казахского языка на латинский алфавит. …» .

 

II. Исторические сведения о казахской письменности.

Казахская письменность берет свое начало с древнетюркских рунических письменностей VI–X вв. н.э. В связи с распространением ислама в тюркском мире с IХ по XX век н.э. использовался арабский алфавит. В 1912 году с арабского алфавита исключили все арабские буквы, обозначающие не казахские звуки и перешли на новый алфавит казахского языка, который содержал 24 буквы на основе арабской графики и 1 апостроф. Этим алфавитом в нашей стране пользовались до 1929 года, а казахи, живущие в других странах пользуются им и по сей день, добавив еще 3 буквы для обозначения согласных (вы), (фы) и (хы). В 1929 году был принят алфавит на основе латиницы, а в 1940 году – алфавит на основе кириллицы. Были добавлены 10 новых букв: две буквы Ьь и Ъъ для обозначения мягкости и твердости согласных, 8 букв Ёё, Ии, Уу, Цц, Чч, Щщ, Ээ, Юю, Яя для обозначения не свойственных к казахскому языку русских звуков. Этот алфавит действует до сих пор .

В таблице 1 показано обозначение фонем (значимых звуков) казахского языка в XХ-ом веке, без указанных кириллических 10 букв.

 

Таблица 1.  Обозначение фонем казахского языка в ХХ-ом веке.


Название звуков

Обозначение

на арабице

Обозначение

на латинице

Обозначение

на кириллице

1        

(а)

ا

A а

A а

2        

(ә)

ٵ

Ә ә

Ә ә

3        

(бы)

ب

B в

Б б

4        

(вы)

ۆ

Vv

В в

5        

(гі)

گ

G g

Г г

6        

(ғы )

ع

Ġ ģ

Ғ ғ

7        

(ды)

د

D d

Д д

8        

(е)

ه

E е

Е е

9        

(жы)

ج

Č č

Ж ж

10   

(зы)

ز

Z z

З з

11   

(й)

ي

J j

Й й

12   

(кі)

ك

K k

К к

13   

(қы)

ق

Q q

Қ қ

14   

(ыл)

ل

L l

Л л

15   

(мы)

م

M m

М м

16   

(ны)

ن

N n

Н н

17   

(ың)

ڭ

Ң ң

18   

(o)

و

O о

 О о

19   

(ө)

ٶ

Ө ө

Ө ө

20   

(пы)

پ

Р р

П п

21   

(ыр)

ر

R r

Р р

22   

(сы)

س

S s

С с

23   

(ты)

ت

T t

Т т

24   

(у)

ۋ

V v

У у

25   

(ұ)

ۇ

U u

Ұ ұ

26   

(ү)

ٷ

Y у

Ү ү

27   

(фы)

ف

F f

Ф ф

28   

(хы)

ح

H h

Х х

29   

(шы)

ش

C c

Ш ш

30   

(ы)

ى

Ь ь

Ы ы

31   

(і)

ٴى

I і

І і

 

ІІІ. Существующие противоречия в казахской письменности.

Здесь мы покажем наличие противоречия в казахской письменности, для этого рассмотрим 2 примера:

1.  Использование в казахском языке гласных звуков (и) и (у) породило ряд противоречий. Так, например, в современном казахском письме к словам «би» - танец, «ми» - мозг, «бу» - пар, «гу» - гул, которые заканчиваются на звуки (и) и (у), притяжательные окончания в третьем лице добавляются как «ми+ы», «би+i», «ту+ы», «гу+і». Они противоречат правилу: В казахском языке к словам, заканчивающимся на согласные, присоединяется притягательное окончание в третьем лице «i» или «ы», а к словам, заканчивающимся на гласные «сi» или «сы».

Если в казахском языке звуки (и) и (у) считать согласными, то в словах «ми», «би», «ту», «гу» не окажется ни одного слога. Отсюда возникает два вопроса: Правильны ли  в казахском языке правила для окончаний?”, “Бывают ли в казахском языке слова без единого слога?”. Чтобы не порождать подобные вопросы, необходимо правильно переписать эти слова с помощью казахских звуков: «мый», «бій», «тұу», «гүу». Тогда единицы произношения казахского языка типа корень, слог и морфема будут писаться без искажения, т.е. упомянутые окончания добавятся как «мый+ы», «бій+і», «тұу+ы», «гүу+і».

Отсюда можно заключить, что, во-первых, в казахском языке нет гласного звука (и), во-вторых, звук (у), обозначенный сейчас буквой Уу, является согласным и этого звука его нет в русском языке, но он есть в английском языке и обозначается в международном фонетическом алфавите – МФА как [w]. Звук в русском языке, обозначенный буквой Уу, является гласным и в МФА имеет обозначение [u], т.е., несмотря на схожесть звучания, нельзя путать между собой согласный звук [w] в казахском языке и гласный звук [u] в русском языке. Правильное использование указанных звуков в казахском языке будет подтверждать правило: «В казахском языке слог внутри слова не может начинаться с гласного звука», т.е. исправленные слова правильно разделятся на слоги в виде «мы-йы», «бі-йі», «тұ-уы», «гү-уі» и не нарушат слоговый состав слов.

2. Русские гласные звуки (ю) и (я) согласно действующей казахской орфографии во многих словах встречаются в сочетании с другими гласными. Например, аю, ою, үю, ая, оя, ұя, что противоречит правилу «В корневых словах казахского языка не должны встречаться подряд два гласных звуков». Поэтому вместо этих русских звуков надо использовать сочетания исконно казахских звуков (йұу, йүу) и (йа, йә) соответственно. Тогда мы писали бы: айұу, ойұу, үйүу, айа, ойа, ұйа, что не нарушает ни одного правила казахского языка, в том числе и правила образования слогов и правила добавления морфем. Подобные противоречия отрицательно отражаются на культуре письменной речи. В целом, современное состояние казахского языка не позволяет развивать и использовать его как государственный язык. Поэтому необходимо исправить сложившееся положение. Для этого необходимо провести комплексную реформу казахского языка. Первоочередными задачами такой реформы являются:

1.  Уточнение звуковой системы казахского языка с учетом результатов предыдущих реформ. При этом из заимствованных звуков оставить в системе только те, которые используются в международных непереводимых на казахский язык терминах и не нарушают внутренние закономерности казахского языка.

2.  Определить состав нового алфавита на основе латиницы. При этом новый алфавит должен позволить эффективно использовать информационно-коммуникационные технологии.

3.  Разработать новые орфоэпические и орфографические нормы казахского языка. При этом заимствованные непереводимые на казахский язык термины должны произноситься и писаться в соответствии с нормами казахского языка. 

При уточнении звуковой системы казахского языка следует учесть, что заимстованные согласные звуки (вы), (фы), (хы) и гласные звуки (и), (у) часто используются для написания фамилий и международных непереводимых на казахский язык терминах. Например: Вагнер, Хонекер, Форд, Иванов, Хомский, Хинчин, вагон,  вектор, вето, викторина, вирус, интернет, инвестор, институт, университет, универсам, хлор, хром, хроника, факт, файл, физика, факультет, федерация, филармония, фонетика, формула, функция.

Все названные звуки внедрились в казахский язык так глубоко, что даже у современных носителей казахского языка адаптировались органы речи для их артикуляции (произношения).

Все указанные звуки не входят в состав суффиксов и окончаний, не влияют на образование новых слов и словоформ. Поэтому их надо использовать при составлении нового казахского алфавита. От этого казахский язык не пострадает, наоборот, они помогут сблизить произношение и написание международных терминов к их произношению и написанию в оригинале. Однако, сначала  надо применить лингвистический метод по разделению звуков языка на фонемы и аллофоны. В алфавите любого языка фонемы имеют отдельные графемы, а аллофоны их не имеют, но они обозначаются отдельными символами в МФА и будут присутствовать в транскрипциях других фонетических единиц.

Для определения нового алфавита казахского языка на основе латинской графики согласные звуки (вы), (фы), (хы) будут считаться фонемами, а гласные звуки (и) и (у) аллофонами исконно казахских гласных фонем (і) и (ұ), соответственно.

Переход гласных звуков (и) и (у) из статуса фонемы в действующем алфавите на основе кириллицы в статус аллофона в новом алфавите на основе латиницы обьясняется тем, что согласно МФА произношение гласного звук (и)[i] может варьироваться от русского гласного звука (и) до казахского гласного звука (і) -[ɪ] и, аналогично, произношение звука (у) - [u] может варьироваться от русского гласного звука (у) до казахского гласного звука (ұ) - [ʊ]  (здесь в круглой скобке – наименование звука, а в квадратной скобке – его обозначение в МФА). Этот феномен, когда два звука могут одинаково встречаться в определенном контексте, при этом, замена одного из них на другой не порождает новое слово или предложение, называется Свободное варьирование. Поэтому звуки (и) и (у) как аллофоны не будут обозначаться отдельными буквами в новом алфавите. Такая практика имеется во многих (английский, французский, турецкий, узбекский и других) языках.

Таким образом, можно считать, что в реформе казахского языка будут участвовать 31 фонема, из них 9 гласных фонем и 2 аллофоны: (а) - [ɑ],         (ә)-[æ], (е) - [е], (o) - [ɔ], (ө) - [ɵ], (ұ) - [ʊ, u], (ү) - [ʏ], (ы) - [ɤ], (і) - [ɪ, i];    22 согласные фонемы: (бы) - [b], (вы) - [v], (ғы) - [ɣ], (гі) - [g], (ды) -  (кі) - [k], (қы) - [q], (жы) - [Ʒ], (зы) - [z], (й) - [j], (ыл) - [l], (мы) - [m], (ны) - [n], (ың) - [ŋ], (пы) - [p], (ыр) - [r], (сы) - [s],  (ты) - [t], (ў) - [w],        (фы) - [f], (хы) - [h], (шы) - [ʃ], которые должны обозначаться отдельными графемами (буквами) в алфавите.

 

III. Адаптация латинского алфавите к другим языка.

Латинский алфавит (латиница) произошел от западного варианта греческого алфавита и возник  в VII веке до н. э.  и  содержал 21 прописную букву, позже в него включили еще 5 букв и строчные буквы. Затем 26 буквенный латинский алфавит зафиксирован Международной организацией по стандартизации  ̶ International Organization for Standardization (ISO) как «базовый латинский алфавит». Он совпадает с современным английским алфавитом и является основой письменности большинства других языков .

В настоящее время 26 буквенный базовый латинский алфавит де-факто стал «алфавитом международного общения», так как все знакомятся с ним еще со школы. Неоднократно выдвигалась идея перевода письменностей всех языков на этот алфавит. Однако в некоторых языках количество звуков больше, чем количество букв в этом алфавите, и в зависимости от их фонетических систем некоторые буквы должны иметь другие значения. Поэтому для таких языков приходиться адаптировать базовый латинский алфавит. В процессе его адаптации к другим языкам возникла проблема обозначения звуков, для которых отсутствовали буквы в нем. Для решения этой проблемы использовались следующие методы адаптации алфавита:

1.  Использование цепочек букв (диграфов, триграфов, тетраграфов) для написания одного звука: например, для обозначения звуков (ш) - [ʃ] и (ч) - [tʃ]  в английском языке используются диграфы sh и ch, а в немецком языке  ̶  триграф sch и тетраграф tsch, соответственно.

2.  Использование положиттельной диакритики: например, во многих языках использовали буквы типа á, ä, ğ полученные путем добавления точек, птичек и других диакритических знаков существующим буквам алфавита;

3.  Использование отрицательной диакритики: например в турецком языке звук (ы) -  [ɤ] обозначается буквой ı, полученной путем удаления точки от  буквы базового латинского алфавита i;

4.       Введение новых букв, модифицируя имеющиеся в алфавите буквы: например, модифицируя имеющиеся в алфавите буквы c и s для обозначения звуков (си) - [si:] и (эс) - [ es ] в английском языке получим буквы  ç и ş для обозначения звуков (че) - [tʃ] и (ше) - [ʃ] в турецком языке, соответственно.

5.  Введение новых букв за счет взаимственных букв из других алфавитов: например, в некоторых языках буквы ŋ и ɔ заимствованы из греческого алфавита, а буква þ  ̶  из рунической азбуки;

6.  Использование лигатуры, полученной из сращения двух букв: например,  вышеуказанное образование W из двойной VV в поздней латыни, английском, немецком и польском языках или æ из a и e в датском, норвежском и исландском языках.

7.  Использование нескольких букв и диакритического знака для обозначения одного звука, например, в бретонском языке звук «x» обозначается диграфом c и h  с апострофом ', т.е. цепочкой c'h.

8.  Изменение значений отдельных букв в базовом латинском алфавите: например, буква  x  в английском языке обозначает звук (экс) - [eks], а в португальском языке обозначает звук (шиш) - [ʃiʃ].

 

IV. Опыт тюркских стран.

Современный турецкий алфавит на основе латинской графики был принят в 1928 году  и содержит 29 букв Aa, Bb, Cc, Çç, Dd, Ee, Ff, Gg, Ğğ, Hh, Iı, İi, Jj, Kk, Ll, Mm, Nn, Oo, Öö, P, Rr, Ss, Şş, Tt, Uu, Üü, Vv, Yy, Z z, из них 6 букв  Çç, Ğğ, İı, Öö, Şş, Üü  не входят в базовый латинский алфавит и 3 буквы базового латинского алфавита Qq, Xx,Ww не используется .

В начале 1990-х годов, в целях упрощения чтения Туркменской орфографии, туркменская письменность 3 раза была переведена на латинскую графическую основу. Последний вариант 995 года содержит 30 букв Aa, Bb, Çç, Dd, Ee, Ää, Ff, Gg, Hh, Ii, Jj, Žž, Kk, Ll, Mm, Nn, Ňň, Oo, Öö, P, Rr, Ss, Şş, Tt, Uu, Üü, Ww,Yy,Ýý, Zz, из них 8 букв Çç, Ää, Žž, Ňň, Öö, Şş, Üü, Ýý  используются для обозначения специфических туркменских звуков и не входят в базовый латинский алфавит, а 4 буквы базового латинского алфавита Cc, Qq, Vv, Xx не используется .

Узбекский алфавит на основе латиницы в 1990-х годах был принят дважды. Последний вариант 1995 года содержит 24 буквы базового латинского алфавита и 1 знак ′  - аксант эгю, при этом 2 буквы базового латинского алфавита Cc и Ww не используется и ранее используемые 5 диакритические буквы Çç, Ññ, Şş, Ğğ, Öö заменены на 5 диграфов Ch ch, Ng ng, Sh sh, G g′, O o′, а специфическая буква Ɉɉ замена на букву Jj .

Перевод азербайджанскую письменность на латинский алфавит начали в 1992 году и завершили в 2001 году. В алфавите имеются 32 буквы Aa, Bb, Cc, Çç, Dd, Ee, Əə, Ff, Gg, Ğğ, Hh, Xx, Iı, İi, Jj, Kk, Qq, Ll, Mm, Nn, Oo, Öö, P, Rr, Ss, Şş, Tt, Uu, Üü, Vv, Yy, Zz, из них 8 букв Çç, Әә, Ğğ, Iı, İi , Öö, Şş, Üü не входят в базовый латинский алфавит и 2 буквы Cc и Ww не используется .

По алфавитам тюркских языков можно сделать следующие выводы:

-     в указанных алфавитах тюркских языков, кроме узбекского, некоторые буквы не входят в состав базового латинского алфавита и порядок следования букв в них не соответствует порядку их следования в базовом латинском алфавите, что потребуют немалых затрат на разработку программ для сортировки и поиска данных при каждой смене поколений компьютеров и программного обеспечения, так как для базового латинского алфавита они встраивается автоматически.

-     в узбекском алфавите в качестве второй пары диграфа используется знак ′ - аксант эгю (апостроф), который в языках программирования применяется как специальный знак для выделения в тексте отдельных его фрагментов. В случае его использования при компьютерной обработке узбекских текстов звуки [ɔ] и [ɣ], обоначаемые как  O′o′ и G′g′ соответственно, не будут распознаны, что нежелательно.

 

V. Критерий перевода казахского алафавита на латиницу.

Используя некоторые сочетания вышеуказанных методов адаптации латинского алфавита можно построить алфавит казахского языка на основе латинской графики. Для этого мы должны определить критерий и задачи перевода казахской письменности на новый алфавит, а также разработать правила избавления от ненужных казахскому языку русских звуков и разработать алгоритм замены кириллических букв на буквы базового латинского алфавита .

При реализации этого перевода обратим внимание на обстоятельства:

1.  В эпоху информатизации общества во всем мире с помощью информационных коммуникационных технологий (ИКТ) создаются и обрабатываются цифровые ресурсы массового потребления очень большого объема (Big Data), которые требуют прямо пропорциональных по объему интеллектуальных, трудовых и финансовых затрат.

2.  Все производимые в Мире компьютеры изначально поддерживают и будут поддерживать 26 буквенный базовый латинский алфавит, при этом адаптация этих компьютеров к национальным алфавитам, имеющим буквы, не входящие в базовый латинский алфавит, требует разработки и применения специфических шрифтов, драйверов, программ сортировки и поиска информации, которые ориентированы на эти алфавиты и требуют немалых дополнительных интеллектуальных и финансовых затрат. 

3.  С учетом тенденции быстрого роста объема цифровых ресурсов и расширения сферы применения ИКТ мировой общественностью предлагается использовать в глобальном информационном пространстве единый алфавит, совпадающий с базовым латинским алфавитом, в целях упрощения и снижения затрат для создания и обработки этих ресурсов, повсместно создаются стандарты для транслитерации букв национальных алфавитов на буквы базового латинского алфавита. 

4.  Государственный статус казахского языка обязывает к тому, что в нашей стране цифровые ресурсы должны создаваться и обрабатываться на казахском языке.

5.   Существующие информационные ресурсы на казахском языке, находящиеся в различных фондах на бумажных носителях в  алфавите на основе арабицы, латиницы-жаналип и кириллицы должны оцифровываться после их отбора специальной комиссией.

6.  Существующие цифровые информационные ресурсы в  алфавите на основе арабицы, латиницы-жаналип и кириллицы должны конвертироваться на базовый латинский алфавит.

7.  Перевод казахской письменности на базовый латинский алфавит значительно упростит изучение и улучшит развитие казахского языка, так как все грамотные люди знают этого алфавита со школьных лет;

Учитывая опыт адаптации базового латинского к другим языкам и  перспективы создания и развития информационных ресурсов и технологий на казахском языке предлагаются следующий критерий перевода казахской письменности на новый алфавит:

1.  Новый алфавит должен создаваться только на основе звуковой системы казахского языка. Это позволит построить строгие орфоэпические и орфографические нормы в соответствии с внутренними законами казахского языка. Так как в новом алфавите будут отсутствовать буквы, обозначающие звуков русского языка, которые противоречат фонетике казахского языка.

2.  Новый алфавит должен образовываться только из букв базового латинского алфавита. Это позволит людям облегчить письменное общение с друг другом, создание и обрабатку цифровых информационных ресурсов на казахском языке с помощью электронных устройств, без разработки и установки дополнительных шрифтов и драйверов, а также программ для сортировки и поиска данных. Так как они для базового латинского алфавита автоматически встроены во всех производимых электронных устройств.  

3.  Новый алфавит может менять звуковое значение некоторых букв базового латинского алфавита для обозначения звуков казахского языка. Это позволит в новом алфавите для некоторых букв определить новые звуковые значения из звуковой системы казахского языка. Но при их подборе необходимо учитывать близость звучания казахского звука со звучанием звука – оригинала, обозначение которого включен в базовый латинский алфавит. Так как наличие близости облегчит подготовку орфоэпических и орфографических норм казахского языка на основе нового алфавита, ускорит его изучение и использование на практике.      

4.   Новый алфавит при отсутствии адекватного однобуквенного обозначения отдельных казахских звуков должен позволить для их обозначения использовать диграфы. Это потребует, чтобы в качестве диграфов должны быть использованы цепочки, во-первых, из двух букв, не встречающихся рядом в казахских простых словах, или во-вторых, из буквы и специального знака, не включенного в алфавит языков программирования. Так как, во-первых, если буквы, включенные в конкретный диграф будут встречаться рядом в казахском простом слове, то звук, который обозначен этим диграфом не будут распознаваться, во-вторых, если специальный знак, используемый в диграфе включен в алфавит языка программирования, с помощью которого обрабатывается казахский текст, то звук, в обозначении которого участвует этот специальный знак не будет распознаваться.

5.  Новый алфавит должен иметь порядок взаиморасположения букв, полностью совпадающий с порядком взаиморасположения букв в базовом латинском алфавите. Это позволит при создании или применении информационных технологий и ресурсов на казахском языке без дополнительных затрат использовать программы для сортировки и поиска данных. Так как, для базового латинского алфавита программы для сортировки и поиска данных автоматически встроены в состав всех системных и прикладных программ. Если новый алфавит имеет порядок взаиморасположения букв, не совпадающий с порядком взаиморасположения букв в базовом латинском алфавите, то  необходимо заново разработать и установить программы для сортировки и поиска данных.

 

VI.    Уточнение звуковой системы казахского языка.

Осуществление перевода письменности любого языка с одной графики на другую требует комплекса работ, связанных с уточнением его звуковой системы, с изменением его орфоэпических, орфографических, морфологических и синтаксических правил, с разработкой компьютерных программ прямого и обратного  преобразования текстов в исходном алфавите на тексты в новом алфавите и наоборот, а также с созданием соответствующих словарей и подготовки многоуровневых учебных изданий

Что касается казахского языка, то до сих пор состав его звуковой системы является предметом дискуссии, издаются учебные пособия и научные труды, в которых даются разные сведения о количестве и типе казахских звуков. 

При уточнении системы звуков казахского языка необходимо учитвать, что среди заиствованных звуков,  гласные (и), (у)  и согласные  (вы), (фы), (хы) часто используются для написания фамилий и международных непереводимых на казахский язык терминов. Например: Вагнер, Форд, Хонекер, Иванов,  вектор, вирус, интернет, инвестор, институт, университет, универсам, хлор, хром, хроника, факт, файл, фонетика, формула, функция. Поэтому их следует оставить в звуковой системе казахского языка, при этом гласные (и) и (у) будут считаться аллофонами гласных фонем (і) и (ұ), соответственно, и будут обозначать той же буквой (графемой), что и  фонема (і), а согласные (вы), (фы), (хы) останутся как фонемы и для их обозначения будут выделены отдельные буквы в новом алфавите .

Также в звуковую систему казахского языка можно добавить и согласные звуки (цы) -  [t͡s], (чы) - [ʧ], которые широко используются в современной лексике казахского языка (конституция, революция, чартер, чемпион)  и не нарушают фонетические закономерности.

Таким образом можно считать, что в реформе казахского языка будут участвовать 33 фонем, из них 9 гласных фонем и  24 согласных фонем: (а) - [ɑ], (ә)-[æ], (е) - [е], (o) - [ɔ], (ө) - [ɵ], (ұ) - [ʊ], (ү) - [ʏ], (ы) - [ɤ], (і) - [ɪ];    22 согласных фонем: (бы) - [b], (вы) - [v], (ғы) - [ɣ], (гі) - [g], (ды) -  (кі) - [k], (қы) - [q], (жы) - [Ʒ], (зы) - [z], (й) - [j], (ыл) - [l], (мы) - [m], (ны) - [n], (ың) - [ŋ], (пы) - [p], (ыр) - [r], (сы) - [s],  (ты) - [t], (цы) -  [t͡s],  (ў) - [w], (фы) - [f], (хы) - [h], (шы) - [ʃ], (чы) - [ʃ].

При этом заимствованные гласные звуки (и), (у) и согласный звук (хі) будут приняты в качестве аллофонов гласных фонем (і), (ұ) и согласной фонемы (хы), которые не будут обозначать отдельными латинскими буквами. Они будут обозначаться теми же буквами, что и звуки (і), (ұ) и (хы) соответственно. Такая норма принято во могих языках мира, например в английском языке.

  

VII. Задачи перевода казахского алафавита на латиницу.

Далее учитывая, что в базовомом латинском алфавите имеются 26 букв, а в казахском языке - 33 фонем, для определения нового алфавита казахского языка мы должны решить следующие задачи:

1)     определить звуки, обозначаемые только одной буквой;

2)     определить звуки, обозначаемые диграфами;

3)     определить значения диграфов;

4)     обновить орфоэпические и орфографические нормы, а также морфологические и синтаксические правила казахского языка;

5)     разработать технологии для их компьютерной обработки и подготовить интеллектуальные сетевые многоуровневые учебные пособия и учебники с речевыми интерфейсами, позволяющие обучиться казахскому языку через любые мобильные устройства.

Решения этих задач будут основываться на:

-     результатах исследования текстового корпуса казахского языка, содержащего 100 миллионов букв действующего алфавита на основе кириллицы , с целью определения частоты употребления букв и сочетания букв в казахском тексте;

-     математической модели и геометрической модели системы гласных казахских звуков  отражающие их классификацию ;

-     осцилограммы гласных звуков, позволищие установить между мягкими и твердыми гласными звуками казахского языка отношения, которые будут использоваться для обозначения диграфами мягких гласных : 

(ә)  =  (а)+(е) или [æ]  =  [ɑ] +[e],        (ө)  =  (і)+(е) или [ɵ] =  [ɔ]+[e],

(ү)  =  (ұ)+(е) или [ʏ]  =  [ʊ] +[e],       (і)  =  (ы)+(е) или [ɪ]  =  [ɤ] +[e].

Результаты исследования этого казахского текстового корпуса также помогли разработать правила избавления казахского текста на действующем алфавите на основе кириллицы от букв Ёё, Ии, Ээ, Юю, Яя, Щщ, Ьь, Ъъ, звуковые значения которых не будут входить в звуковую систему казахского языка.  На основании этих правил был создан  переходной орфографический словарь казахского языка на кириллице, без этих букв.

Этот словарь будет служить исходной базой данных для автоматического перевода казахской письменности на латиницу, который будет состоять из двух этапов: первый этап - перевод исходного текста на промежуточный текст без букв Ёё,  Ээ, Юю, Яя, Щщ, Ьь, Ъъ; второй этап – перевод промежуточного текста на латиницу. Реализуя эти этапы мы разработали и внедрили конвертор для автоматического перевода любого казахского текста с кириллицы на латиницу: http//alphabet.kz/convertor.

     

VIII.Правила перевода казахской письменности на латиницу

Осуществление перевода письменности любого языка с одной графики на другую требует комплекса работ, связанных с уточнением его звуковой системы, с изменением его орфоэпических, орфографических правил .

В реформе по переводу казахской письменности на латиницу будут участвовать 33 фонем, из них 9 гласных фонем, 24 согласных фонем. В  действующем на основе кириллицы алфавите имеются 42 буквы, из которых 10 букв Ёё, Ээ, Юю, Яя, Цц, Чч, Щщ. Ьь, Ъъ используются для обозначения звуков русского языка и в основном встречаются в заимствованных словах.

Поэтому нам необходимо построить следующие правила:

-     правилы удаления из слов букв Ёё, Ээ, Юю,Яя, Щщ, Ьь, Ъъ;

-     правилы обработки буквы Уу в словах;

-     правилы обработки букв Аа, Әә, Оо, Өө, Ұұ, Үү, Ы,ы, Іі в словах.

Для обозначения казахских фонем буквами базового латинского алфавита используется схожесть их обозначения в МФА [31, 32] и предлагаются 3 группы правил:

1.       Один звук и одна буква:

1.1.    5 казахские гласные фонемы (а) - [ɑ], (е) - [e], (o) - (о), (ұ) - [ʊ] и (ы) - [ɤ] будут обозначаться 5 латинскими буквами Aa, Ee, Oo, Uu и Yy, значениями которых являются созвучные с ними звуки, имеющие в МФА одинаковые обозначения с обозначениями указанных казахских фонем, cоответственно;

1.2.    18 казахские  согласные фонемы  (бы) - [b], (вы) - [v],               (гі) - [g], (ды) - [d], (фы) - [f], (й) - [j], (кі) - [k], (қы) - [q], (ыл) - [l], (мы) - [m], (ны) - [n], (пы) - [p], (ыр) - [r], (сы) - [с], (ты) - [t], (у) - [w], (хы) - [x] и (зы) - [z] будут обозначаться 18 латинскими буквами Bb, Vv, Gg, Dd, Ff, Jj, Kk, Qq, Ll, Mm, Nn, P, Rr, Ss, Tt, Ww, Xx и Zz, значениями которых являются созвучные с ними звуки, имеющие в МФА одинаковые обозначения с обозначениями указанных казахских фонем, cоответственно;

1.3.    Взаимствованный согласный звук (цы) -  [t͡s]  будет обозначаться латинской буквой Cc.

 

2.       Один звук и диграф:

2.1.    Казахские 3 гласные мягкие фонемы (ә) - [æ], (ө) - [ɵ],  (ү) - [ʏ] будут обозначаться диграфами, в которых первыми парами являются латинские буквы Aa, Oo и Uu, обозначающие близкие по звучанию твердые гласные (а) - [ɑ], (o) – [о] и (ұ) - [ʊ], соответственно, а второй парой каждого диграфа будет латинская буква Eе для второго варианта алфавита (как это принято в «компьютерном» немецком алфавите), так как ни в одном казахском простом слове не встречаются подряд звуки (ае), (ое) и (өе), что не будут порождать орграфические противоречия.

Замечание: Латинская буква Hh не будет обозначать никакокую казахскую фонему, она будет служить только в качестве второй пары диграфов для обозначения казахских согласных фонем (ғы), (жы), (шы) и взаимствованной фонемы (чы). 

2.2.    Казахская согласная (ғы ) - [ɣ] будет обозначаться диграфом, в котором первой парой будет латинская буква Gg, обозначающая близкий по звучанию согласный звук (гі) - [g], а второй парой - латинская буква Hh. Такой диграф в новом алфавите не будет порождать орфографические противоречия в казахской письменности на латинце.

2.3.    Казахская согласная (жы) - [Ʒ] будет обозначаться диграфом, в котором первой парой будет латинская буква Zz, обозначающая близкий по звучанию согласный звук (зы) - [z], а второй парой - латинская буква Hh. Такой диграф в новом алфавите не будет порождать орфографические противоречия в казахской письменности на латинце.

2.4.    Казахская согласная фонема (шы) - [ʃ] будет обозначаться диграфом, в котором первой парой будет латинская буква Ss, обозначающая близкий по звучанию согласный звук (сы) - [s], а второй парой - латинская буква Hh.  Такой диграф в новом алфавите не будет порождать орфографические противоречия в казахской письменности на латинце.

2.5.    Взаимствованная согласная фонема (чы) - [ʧ] будет обозначаться диграфом, в котором первой парой будет латинская буква Cc, обозначающая близкий по звучанию согласный звук (цы) -  [t͡s], а второй парой - латинская буква Hh.  Такой диграф в новом алфавите не будет порождать орфографические противоречия в казахской письменности на латинце.

2.6.    Казахская согласная сонорная фонема (ың) - [ŋ] будет обозначаться диграфом. Первой парой диграфа будет латинская буква Nn, обозначающая фонему (ны) - [n], которая по своему значению близок фонеме (ың) - [ŋ]. Второй парой диграфа будет латинская буква Gg, обозначающая звук (гі) - [g]  (как это принято в английском и узбекском языках). В записи в новом алфавите диграф «ng» должен содержаться только в одном слоге, так как в казахском слове никогда перед звуком (ың) - [ŋ] не встречается согласный звук и нет слова, которое начинается со звука  (ың) - [ŋ].

Однако, некоторые разные по произношению и смыслу слова в предлагаемом алфавите будут писаться единтично. Например, разные слова «күңі» и «күнгі» в предлагаемом алфавите будут писаться одинаково как «kyengi».

Для того, чтобы не допустить подобные случаи необходимо принять следующее правило: Если при записи в латинском алфавите казахского слова после буквы Nn, обозначающей согласный звук (ны) - [n], необходимо писать букву Gg, обозначающей согласный звук (гі) - [g] (такой случай возможен только в исконно казахских словах), то вместо буквы Nn надо писать диграф «ng», который обозначает согласный звук (ың) - [ŋ]. Это будет соответствовать закономерности произношения (ассимиляции звука ) в казахском языке и в его письменности не порождает никакие противоречия. Например, выше приведенные слова «күңі» и «күнгі» будут писать по разному как «kyengi» и «kyenggi», что не порождает противоречия в новой орфографии казахского языка на латинце.

Замечание: Диграфы не являются элементами алфавита, они являются орфографическими правилами.

 

3.       Одна буква и два звука.

3.1.             В действующем алфавите есть кириллическая буква Ии. Во-первых, она встречается в заимствованных словах и на практике носителями казахского языка произносится как исконно казахский звук (i), например, интернет = (інтернет), инвестор = (інвестор),  институт = (інстітұт). Во-вторых, в исконно казахских словах во всех случаях произносится как сочетание звуков (ій) или (ый) в зависимости от мягкости или твердости контекста, например, киік – (кійік), қиық – (қыйык), тиін – (тійін), тиын – (тыйын), ғылыми – (ғылымый), ресми – (ресмій), ылғи – (ылғый), ылди = ылдый, қияли = қыйалый, адами = адамый,  ғылыми = ғылымый, тарихи = тарихый.

Поэтому в первом случае, русский гласный звук (и) нужно принять как аллофон казахской фонемы (і). Во втором случае, просто привести в порядок орфографические правила и тогда не будет никаких орфографических противоречий, указанных во Введении настоящей работы (см. стр. 24-25).  Тогда латинская буква Іі будет обозначать как фонему (і), так и её аллофон (и), которые в МФА будут обозначаться символами [ɪ] и [i], соответственно, как это принято во многих алфавитах других языков (например, в английском языке: bit [bɪt] и bite [baɪt]). То есть заимствованный гласный аллофон (и) не будет обозначаться отдельной графемой, он будет обозначаться той же латинской буквой Ii, которой обозначается казахская гласная фонема (і).

3.2.             Также в действующем алфавите есть кириллическая буква Уу. Во-первых, она встречается в заимствованных словах и на практике носителями казахского языка произносится как исконно казахский звук (ұ), например, универсам = (ұниверсам), университет = (ұниверситет),  формула = (формұла). Во-вторых, она в исконно казахских словах во всех случаях  произносится как сочетание звуков (үу) или (ұу) в зависимости от мягкости или твердости контекста.

Поэтому в первом случае, русский гласный звук (у) нужно принять как аллофон казахской фонемы (ұ). Во втором случае, просто привести в порядок орфографические правила и тогда не будет никаких орфографических противоречий, указанных во Введении настоящей работы (см. стр. 24-25). Тогда латинская буква Uu будет обозначать как фонему (ұ), так и её аллофон (у), которые в МФА будут обозначаться символами [ʊ] и [u], соответственно, как это принято во многих алфавитах других языков (например, в английском языке: put [pʊt], but [bʌt] и tube [tu:b]). То есть гласный аллофон (у) не будет обозначаться отдельной графемой, он будет обозначаться той же латинской буквой Uu, которой обозначается казахская гласная фонема (ұ).

4.                     Латинская буква X x, используется для обозначения сочетание звуков КС кс, что позволяет заимствованные термины будут совпадать с их оригиналами.

Например,   ксерокс = xerox, эксперт = expert, экспoрт = export, ЭКСПО = EXPO.

 

Заключение.

В заключении можно сказать, что с 26 буквами базового латинского алфавита удалось обозначить 33 фонем казахского языка, из них 25 фонем обозначены отдельными буквами, а 8 фонем обозначены диграфами. Одна латинская буква Hh используется только в качестве второй пары диграфов для обозначения согласных фонем. Для всех фонем,  включая аллофоны,  определены обозначения в МФА.

Аллофоны гласных казахских фонем (і) и (ұ) позволит сблизить написание многих заимствованных и подлежащих к заимствованию непереводимых на казахский язык международных терминов в новом алфавите с их оригиналами, сохраняя казахское произношение.

В результате предложены проект нового алфавита казахского языка на основе латинской графики с указанием соответствующих обозначений в МФА: в первом варианте алфавита содержатся только 26 букв базового латинского алфавита, а во втором варианте, помимо этих букв, содержится и знак ` - аксант грав, который будет используется в диграфах, как вторая пара каждого диграфа. В таблице 2 приведен предложенный алфавит, в таблице 3 орфографические правила для диграфов, а таблице 4 текст Гимна Республики Казахстан в действующем и предложенном алфавите.

Таблица 2. Казахский алфавит на основе латиницы.

Латиница

Название звука

Кириллица

МФА

1        

а

(а)

А а

[ɑ]

2        

в

(бы)

Б б

[b]

3        

С с

(цы) 

Цц

[t͡s]

4        

D d

(ды)

Д д

[d]

5        

E е

(е)

Е е

Е е

6        

F f

(фы)

Ф ф

[f]

7        

G g

(гі)

Г г

[g]

8        

H h

(хы, хі)

Хх, Һһ

[h]

9        

і

(і), (и)

І і

[ɪ, i]

10  

j

(й)

Й й

[j]

11  

K k

(кі)

К к

[k]

12  

L l

(ыл)

Л л

[l]

13  

M m

(мы)

М м

[m]

14  

N n

(ны)

Н н

[n]

15  

о

(o)

О о

[ɔ]

16  

P p

(пы)

П п

[p]

17  

Q q

(қы)

Қ қ

[q]

18  

r

(ры)

Р р

[r]

19  

S s

(сы)

С с

[s]

20  

T t

(ты)

Т т

[t][u1] 

21  

U u

(ұ)

Ұ ұ

 , u]

22  

V v

(вы)

В в

[v]

23  

Ww

(ў)

У у

[w]

24  

X x

(кс)

 КС кс

[x]

25  

Y у

(ы)

Ы ы

[ɤ]

26  

Z z

(зы)

З з

[z]

 


Таблица 3. Орфографические правила для диграфов

Название звука

Кириллица

МФА

Латиница

Пояснение

 

1        

(ә)

Ә ә

[æ]

Ae ae

Как в компьютерном немецком языке

2        

(ө)

Ө ө

[ɵ]

Oe oe

Как в компьютерном немецком языке

3        

(ү)

Ү ү

(ү)

Ue ue

Как в компьютерном немецком языке

4        

(ғы)

Ғ ғ

[ɣ]

Gh gh

Как в компьютерном немецком языке

5        

(жы)

Ж ж

[Ʒ]

Zh zh

Как в компьютерном немецком языке

6        

(ың)

Ң ң

[ŋ]

Ng ng

Как в английском языке

7        

(шы)

Ш ш

[ʃ]

Sh sh

Как в английском языке

8        

(чы)

Ч ч

[ʧ]

Ch ch

Как в английском языке

 


 

Таблица 4. Гимн Республики Казахстан

Действующй алфавит

Предложенный алфавит

Алтын күн аспаны, 
Алтын дән даласы, 
Ерліктің дастаны, 
Еліме қарашы!
Ежелден ер деген, 
Даңкымыз шықты ғой. 
Намысын бермеген, 
Қазағым мықты ғой

Altyn kuen aspany,

Altyn daen dalasy,

Erlikting dastany,

Elime qarashy!

Ezhelden er degen,

Dangqymyz shyqty ghoj.

Namysyn bermegen,

Qazaghym myqty ghoj!

 

Қайырмасы:

Менің елім, менің елім,
Гүлің болып егілемін, 
Жырың болып төгілемін, елім! 
Туған жерім менің 
 Қазақстаным!

 

Qajyrmasy:

Mening elim, mening elim,

Gueling bolyp egilemin,

Zhyryng bolyp toegilemin, elim!

Tughan zherim mening – Qazaqstanym!

 

Ұрпаққа жол ашқан, 
Кең байтақ жерім бар. 
Бірлігі жарасқан, 
Тәуелсіз елім бар. 
Қарсы алған уақытты, 
Мәңгілік досындай. 
Біздің ел бақытты, 
Біздің ел осындай!

Urpaqqa zhol ashqan,

Keng bajtaq cerim bar,

Birligi zharasqan,

Taewelsiz elim bar

Qarsy alghan waqytty,

Maenggilik dosyndaj,

Bizding el baqytty,

Bizding el osyndaj! 

 

Қазақ елі – мәңгілік ел

 

Qazaq eli – maenggilik el!

 

 


 [u1]Т может быть и альвеоляным в мягких - терезе