Қазақша Wikipedia дамыса, Интернетте қазақ тілді контент көбейетіні рас па?

Блог - urimtal: Қазақша Wikipedia дамыса, Интернетте қазақ тілді контент көбейетіні рас па?Бүгін Google компаниясында қызмет ететін жалғыз қазақстандық — Рүстем Арзымбетовпен кездестім. Сөзінің басын «Wikipedia қазақшасын дамытсаңдар ғой жақсы болар еді» деп бастады. Менің ойым таяуда ғана translate.google.com-ға қосылған әзірбайжан тілін байқап, қазақ тілін де қосу мүмкіндігінің мән-жайына қанығу болатын.

Сөйтсем, Рүстемнің айтқанынан түсінгенім, Google Translate-те қазақ тілі болуы үшін қазақ тілінің өзге тілден аударылған корпусы болуы керек екен. Ал ондай тілдік корпус жасауға wikipedia тәрізді бірнеше тілдерден мақалалар аударылатын жобалардың берері мол (келесі бір жолы ол үкіметтің өзі қос тілді корпусты Google-ға ұсынуы, яки wikipedia сияқты өзге бір тәсілдер).

Яғни, егер wikipedia-да ағылшын тілінен аударылған жазбалар немесе қазақ тілінен ағылшын тіліне аударылған жазбалар көп болса, Google сол аудармалар негізінде аударма бағдарламасын түзеді-мыс.

Тіпті, біздің аударма материалдарды берумен шектелетін ресми сайттардың да осы орайда қосатын үлестері зор екен. Себебі Google Translate-тегі бағдарлама интернеттен қос тілді контенттерді іздеп, соның негізінде автоматты аударатын бағдарлама түзіп шығарады.

Әлі де сенімсіз болатыным, бұл мәліметтің анық-қанығын тағы тексере түссем, жұрттың осыған қатысты білері болса, оларды да тыңдасам деймін.

Бір білерім, біздің ҚР Ақпарат және Байланыс министрлігі де т.б. көптеген ресми орындар да тіпті қарапайым интернет қолданушылар да интернетте мәтінді (тек қана жекелеген сөздерді емес) қазақ тіліне аударатын онлайн аудармашының болғанына мүдделі. Қазір бірен-саран аударма бағдарламалар кездеседі. Олар әдетте қазақ тілінен орыс тіліне сосын орыс тілінен ағылшын тіліне аударады. Мәтінді тікелей қазақша-ағылшынша аударатын ресурс көрмедім.

«Тіл корпусы» деген сөзді алғаш естігенде менің де бұл не деп таң қалғаным бар. Көз алдыма неге екені бір қорап елестейтін. Тілтанушылардың айтқанынан түсінгенім тіл корпусы дегеніміз — белгілі бір тілдің электронды мәтіндері негізінде жинақталған ақпараттық-анықтамалық жүйе. Корпустан тілдің белгілі бір кездегі күллі болмысын (жанр, стиль, аймақтық және әлеуметтік сипаты т.с.с.) анықтауға болады екен.

Осыдан екі жылдай бұрын ҚР Мәдениет министрлігіне қарасты Тіл комитеті Қазақ тілінің корпусын жасауды қолға алған. Бірақ ол тек Қазақ тілінің корпусы болатын. Бұның өзі де қазақ тілінің дамуына жасалған үлкен жұмыс.

Тіл ұстарту блогының авторы Sagym-ның да көптеген жазбалары осы тақырыпқа арналған еді. Өкінішке қарай, тіл мамандары тарапынан бұл жазбаларға көп назар аударылмады. Бәлкім келешектің еншісіндегі іс болар.

Wikipedia-ға көбіне қазақша мақалалар енгізу керек деп түсінетінмін. «Мәссаған» жастар порталын құрушылардың бірі — Бақытнұр өз блогында да осы мәселеге қатысты ойларымен бөліскен:

Қазақ тілінде де Уикипедия Қазақша Ашық Энциклопедиясы деген бар. Бұл соңғы 2 жылдан бері үздіксіз жұмыстап келе жатқанын біреу біледі, біреу білмейді (мүмкін көпшілігіміз мүмкін ағылшын тіліндегін білетін шығармыз. ) не жалқауланып жүргендіктен ба әйтеуір Уикипедияны алып жүргізіп келе жатқан кісілер саны аз.


Бұған үн қатқан Бақытүл де өз ойларын айтып еді:

«Wikipedia энциклопедиясының неміс тілді бөлімі мемлекеттен қаржылай көмек алады. Германия шенеуніктері осы арқылы неміс тілінде жүргізілетін Wikipedia-ны одан да «нақты, дәл» мәліметтермен толықтырғылары келеді. Сонымен бірге осы уақытқа дейін аз ашылған тақырыптар төңірегінде ақпараттарды көбейту көзделіп отыр. Ол үшін мамандар таңдалып, әдейі дайындықтан өткізіледі. Осы үрдісті басқару Nova Institute –ке тапсырылған.» Иә, біздің де Мәдениет және ақпарат министрлігі, Тіл дамыту комитеті т.б. да осындай әрекеттерді де ойластырғаны артық болмас еді.

Сөйтсем, wikipedia-ның өзге тілінен (мысалы, ағылшыннан) аудармалар көп болса, соғұрлым онлайн аударманың пайда болуына үлес қосады екенбіз. Енді осы мәліметтердің анықтығы рас болса, қазақ тілінің қос тілді корпусының тезірек пайда болуына мүдделі болуымыз керек сияқты.

Мұның бәрі бізге не береді десек, Wikipedia-да қазақша контенттің (аудармасы бар, тек қазақша түпнұсқадағысы бар)көбеюі өз кезегінде әр қазаққа әлемдік ақпаратқа оңай қол жеткізуге жол ашпақ.

Блог - urimtal: Қазақша Wikipedia дамыса, Интернетте қазақ тілді контент көбейетіні рас па?
Бөлісу:

28 пікір

kazprose
иә, аудармаға зәрулік ұлт дамуының тетігіне айналғалы қашан. Wikipedia-нің аудаумасына тілдік қаблеті бар әр азамат атсалысуы керек деп ойлаймын.
urimtal
Келісемін. Меніңше Google аудармасына қазақ тілі тезірек қосылса, көп іс жеңілдер еді. Қаншама адам, ағылшын тіліндегі мәтіндерді бірден қазақша оқып, түсінер еді.

Түсінгенім, тек wikipedia ғана емес, Интернеттегі екі тілді аударма мәтіндер (қазақша орысша немесе қазақша ағылшынша) көп болған сайын, соғұрлым Google-дың аудармашы машинасының іске қосылуына көбірек жағдай туындамақ.
admin
менің білуімше Ақпарат және Байланыс министрлігінің жоспарында бар Википедияның қазақша бөлігімен айналысу.

мен де солай ойлаймын, егер Викиде контент көбейсе біраз даму болады деп ойлаймын.
urimtal
Рүстеммен сұхбаттасудан да түсінгенім сол болды. Қазір қазақша контентті дамытпасақ, қазақша интернет нарықтың да дамуы екіталай болып тұр ғой.

Baq.kz-ті google news-қа қосу мүмкіндігін сұрағанмын. Мүмкін нәрсе деп жатыр. Тек ол жердегі контенттің көлемі қанша дейді? Білмим дедім. :(
kazprose
Байланыс министрлігі қолға алуға құлық танытар ма екен ә?! Ерте бастан құлақдар бола бергені дұрыс болар.
urimtal
Меніңше егер министрлік осы істі қолға алса, өздеріне үлкен жарнама болады :) Бірақ негізі бұл іспен билік емес қолданушылардың өздері айналысуы керек сияқты. Wikipedia еріктілер есебінен дамитын жоба ғой.
kazprose
еріктілердің зор көлемде дамытуға септігі тиетіндей табыла қоюы екіталай…
urimtal
оның рас, Мейіржан! Күллі мәселенің төркіні осыған келіп тіреледі.
admin
ол жерде әзірше аз контент, сайт енді енді толып келе жатыр. бірақ сайт шалақазақтардың қолында, қазақша сайт дегенді өмірі көрмеген адамдар. білмеймін болашағы қалай болатынын.
urimtal
кем дегенде екі-үш жылға жоспары түзілмеген бе ол жобаның? Министрлік араласқан соң, концепциясы түзіліп, қаржысы бекітіліп, приказ шығып, мөр қойылып дегендей болған шығар десем… :(
umirbek
Бастамаларыңыз сәтті болсын. Интернетте қазақ контенттері көбейсін иншалла kazlife.wordpress.com
urimtal
Негізі бастамамыз деп айтсаңыз да болар еді :) Ортақ дүние ғой. Осы істе моңғол тілі тәжірибесімен бөлісе аласыз ба?
umirbek
Біздің бастамамыз! Әрине:), Моңғолия Ақпараттық технология саласының дамысы, програмист-терінен тәжірибесі нашар емес. Олардан алатын идеалар, бағдарламалық ресурстар көп. Біз мұнда бір системаның бағдарламасы жасап жатырмыз, егер табысты болса жақсы еді. Табысты болған жағдайда қазағымның ақпараттық технологиясының дамуына өзіндік бір үлесін қоса алады дегенге сеніміміз зор. Біз не істеуіміз керек аға істейік.
urimtal
Ісіңе сәттілік тілеймін, Өмірбек!!! Әзірге wikipedia қазақшасын дамытуға қатысты ойларымды жинақтаған жоқпын. Үлкен бір кешенді жұмыс керек екенін түсініп отырмын.

Wikipedia-ның қазіргі күйі мен ол жақта жүрген белсенді жігіттердің пікірлерін де білгім келеді.
umirbek
Әмин.Wikipedia қазақшасын дамытуға қатысты ойларыңызды күтем
Serzha
википедия туралы жоо-лар мұғалімдеріне айту керек сияқты
студенттер рефераттар жазғанша, викиде мақаланы өзіндік жұмыс ретінде тапсырса да болады ғой
muza
Сержа-нын айтканына косылам.Вики-ди ен тез дамытатын жогаргы оку орындарынын устаздары болса керек.Оз тажирибемден Мысалга туркияда буткил жазба тапсырмаларды Вики-де жаздырады.Бул арине бирнеше университетте гана.Бирак ар университетте ен жок дегенде 20 мын студент бар десен бул оте улкен акпарат козгалысы болады.Биздин КАзГу мен Политех-тын озинде 15 мын студент бар деп шешцеколардын 50 мыннан астамы интернетте жазуга кабилетти жане де казакшасы жаксы десек жане сол ар 5000 студент айда жок дегенде бир материял косатын болса Вики-га нагыз казакша акпарат козгалысы болатын еди.
urimtal
Иә, Сержаның пікіріне мен де қосыламын!!!
Zere
Алдында мен сол жерге біраз мақалалар салып едім, Админ типтес біреулер мақаламды түзеп, кейін қазақша сөздерді дұрыс жазбай, менің өзіммен ұрысқан еді. Мен тіптен түсінбей кеттім, сонда бақылайтын да адамдар бар ма деп. Жазуға да көңілім қалды.
urimtal
Зере, осы жайында толығырақ айта аласың ба? Тағы бір кісілерден осындай мәселе бар деп естіп едім.
Zere
Очм, мәліметтерді салған соң, оны біреулер тексеріп, орын-орындарына қояды екен. Сосын мен жазғандарды өз білгендерінше түзейді. Сол жердегі диалог тақтасына жаздым, неге түзейсіздер, қазақша осылай жазылады ғой десем. Өңкей шала қазақтар түк білмейсіңдер, анау-мынау деп жазып тастапты. Содан байқағаным қытайдың қазақтары ма біреулер.
Одан кейін тағы қатты сөздер жазды. Мен де қолымды бір сілтедім.
urimtal
Рахмет, Зере! Шынымен сондай оқиға бұрын орын алған сияқты. Кеше біраз отырып, wikipedia-ны ақтарған едім. Ол жерден бұрынғы админ кетіпті. Орнына қазір басқа бір азамат GaiJin деген никтегі сайланыпты. Ішінде өріп жүрген қатеден менің де басым ауырып кетті. Содан интерфесін ағылшыншаға қойып, тілін қазақшаға ауыстырып, бір екі мәлімет енгізіп көріп едім. Қосылды.
Qojeke
О, қазақша естіменген сөздерді сол жерден оқып біледі екен адам. Ұман, Сұдан,…
omarbirat
Осыдан бірнеше жыл бұрын қазақшасын көріп, мен де түңілген болатынмын. Біраз түзетулер жасап кетіп едім. Түзетулердің әрі қарайғы тағдырын білмеймін.
admin
Викимен тұрақты айналысатын бір ұйым болғаны дұрыс. Министрлік шынымен қолға алса дұрыс болады. Бірақ бұдан кейін министрліктегілер істеп жатыр ғой деп қарапайым юзерлер Викимен айналыспай кетуі мүмкін. бірақ бәрібір ешкім айналысып жатқан жоқ қой :)
qisyq
Ия, Вики қазақшалануы тиіс десем, жындарыңызға тиіп, қайталанғандай боламын-ау,ә:)
Гугл-транслэйтты аудару өте-мөте қажет, қазақтар орыстілді контентпен шектеліп қалмай, балама ақпарат көздеріне қол жеткізе алар еді. Оны кез-келген адам аудара ала ма?
urimtal
Қисық, google-дың Google Translate Toolkit Pro деген өнімі бар. Ішіне қазақ тілін енгізіпті. Бірақ ол тек аударма жасауға арналған бағдарлама. Соның көмегімен уикипедиядағы мақалаларды қазақшаға аударсаң, ол уикидің қазақшасында жарияланады. Кеше солай бір мақаланы тексеріп жарялап көріп едім.
Nurzhol
Шынымен де. Гугл түркі тілдес елдердің тілдерін аудара алатын болса, неге қазақ тіліне де аудармасқа деген ой туатыны сөзсіз. Гугл транслейттің аудару технологиясы кейбір ресурстардың аударылу негізінде жүретінін өз де айтып отырады ғой, мәселен орысшадан ағылшыншаға аударғанда көріп қалатынмын. Бірақ жете түсіне бермеген едім. Енді түсінікті.