سفارش تبلیغ
صبا ویژن
گوگل چگونه زبانها را ترجمه می کند؟

 

در اواخر قرن نوزدهم میلادی L. L. Zamenhof زبان اسپرانتو را ابداع کرد با این امید که یکروزی تمامی انسانها به زبانی مشترک صحبت کرده و رابطه برقرار کنند و نهایتا اینهمه سوتفاهم و درگیریهایی که بشر با آنها امروزه روبروست بتدریج برطرف شود. اما نهایتا این زبان انگلیسی بود که بویژه با ورود اینترنت به صحنه ارتباطات جهانی، زبان اول دنیا شده: امروزه انگلیسی در بیش از 30 کشور دنیا زبان رسمی و اول است و در بسیاری کشورهای دیگر هم بعنوان زبان دوم در مدارس و جامعه تدریس و استفاده می شود. تصور کنید هرگاه که به وبلاگ/سایتهای خارجی مثلا چینی ژاپنی عربی اسپانیول و غیره وارد می شوید همانجا متوقف می شوید چرا که مطالب ارزنده شان با زبان شما یکی نیست.

کمپانی IBM سالها پیش ادعا کرده بود که بزودی در اختراع سیستم ترجمه کامپیوتری حرف اول را خواهد زد اما این گوگل بود که IBM را پس زد و حتی در ترجمه مستقیم و درست زبانهای عربی و چینی به انگلیسی IBM را مغلوب کرد. بطور کلی دو روش برای ترجمه زبانها وجود دارد: ترجمه گرامری و ترجمه(یا مشابه یابی) آماری ( statistical match ).

 البته هر دو سیستم نقاظ ضعف و قوت خود را دارند. مثلا روش گرامری ( سختگیرانه ) را بیشتر در نوشتن و ترجمه کتابهای راهنمای فنی ، مثلا کتاب راهنمای مکانیک و غیره استفاده می کنند و روش آماری/آنالیزی را بیشتر برای گفتگوهای محاوره ای...مثلا ترجمه عبارت " چنین گفت زردشت " که در انگلیسی "Thus Spoke Zarathustra" و به آلمانی "Also sprach Zarathustra" است را با مساوی فرض کردن دو قسمت "thus spoke" و Also sprach و با استفاده ی دیتابیسی از هر دو کتاب میتوان براحتی ترجمه کرد. گوگل بیش از 200 میلیارد کلمه را با استفاده از هزاران مدرک و متن موجود در سازمان ملل متحد وارد دیتابیسش کرده و با استفاده آماری-مقایسه ای ، نزدیکترین و پر استفاده ترین اصطلاحات و جملات را بعنوان ترجمه به کاربران میدهد. و این در حالیست که لزومی ندارد که هیچیک از مهندسان و متخصصان قسمت ترجمه گوگل با این زبانها آشنایی داشته باشند..تمام کارها را ماشین و کامپیوتر عظیم گوگل انجام می دهد بی آنکه این ماشین برایش مهم باشد که گرامر چه اهمیتی دارد و یا مثلا رابطه راه رفتن و پا چیست.....

 سایتهای AOL, Alta Vista, Babblefish و حتی گوگل از تکنولوژی ترجمه ای شرکت Systran که در شهر سن دیه گو (امریکا) و پاریس دفتر دارد و سابقه 30 ساله دارد ، استفاده و روزانه تقریبا 25 میلیون صفحه وب ترجمه می کنند.

اما سیستم ترجمه ماشینی گوگل ( MT system ) ، با مدیریت دکتر Franz Josef Och فرانز جوزف اوچ ، فارغ التحصیل دانشگاه کالیفرنیای جنوبی(که تصویرش را اینجا می بینید) مدارک سازمان ملل را ، مثلا قوانین و سخنرانیها ، به این دلیل استفاده می کند که در این سازمان یک متن یا سخنرانی باید همیشه به دهها زبان مختلف به شکل دقیق و هم معنا و قابل فهم ترجمه شوند. بنابرای یکچنین مدل ترجمه ای ، برای کاربر، رایج تر و قابل فهم تر و امروزی تر است چرا که نمایندگان خودش (کاربر)  در سازمان ملل هم همین نوع واژه ها و اصطلاحات را بکار می برند و یا مثلا در کتابهای شعر و ادبیات هم بیشتر همین کلمات/اصطلاحات استفاده شده و اینجا دیگر گرامر و دستور زبان ملاک و متراژ اصلی نیستند  و ترجمه از آن حالت خشک و رسمی دستور زبانی خارج ، و محاوره ای تر میشود.

فرض کنید که بخواهیم متنی را از انگلیسی  به فارسی ترجمه کنیم: این مدل گوگلی، زبان هدف (یعنی target - زبانی که کاربر میخواهد به آن ترجمه شود ، یعنی فارسی)  را بعنوان یکنوع هدف و کد ناشناس فرض می کند و درست مثل اینکه بخواهد آنرا دی کد deCode  (رمز گشایی) کند عمل کرده و رایج ترین و پر استفاده شده ترین کلمات و اصطلاحات رایج در هزاران کتاب و متن های آن زبان مورد نظر کاربر را ( که در دیتابیس گوگل ذخیره شده) بارها با یکدیگر مقایسه کرده و درین مقایسه ها به بهترین و  پر استفاده ترین کلمات و اصطلاحات زبان دوم (هدف) امتیاز بیشتری می دهد ( اسکور score می دهد و آپتیمایز optimize می کند) و اینکار را آنقدر ادامه می دهد تا اینکه به یک ترجمه برتر و نهایی برسد و تمام این پروسه فقط چند ثانیه طول می کشد..

 این مدل درست شبیه مدل مغز آدمهاست که دایما خودش را با جذب اطلاعات جدیدتر (هرچند کوچک و جزیی) بهبود می بخشد و هر چیز و پدیده ای را بلافاصله مقایسه و تحلیل آماری ( Statistical analysis ) می کند و بهترینش را انتخاب می کند : چرا که اگر بخواهیم خودمان را صرفا به یکسری قوانین و سنتهای گرامری محدود کنیم کمتر نتیجه می گیریم اما مقایسه و آنالیز آماری و احتمالاتی و متریک و بالنده بیشترین نتیجه را میدهد. البته این محک و متراژ (برای مقایسه) هم باید قبلا به درستی تعریف شده و مشخص باشد. 

نکته جالب اینکه چرا گوگل زبانهای عربی و چینی (ماندرین) را بعنوان نخستین پروژه ترجمه زبانهایش برگزید ؟ دکتر مایلز آزبورن Miles Osborne استاد دانشگاه ادینبورگ که روی این پروژه برای گوگل کار کرده می گوید که ارتش و اداره امنیت امریکا بخاطر مسایل امنیتی و ضد تروریستی در این دو منطقه از جهان، نیاز فوری به ترجمه از این دو زبان داشتند و کمک مالی هنگفتی به گوگل درین پروژه کردند تا سریعتر به نتیجه برسد. او می گوید که دولت امریکا به ترجمه هایی که توسط آدمها و مترجمانش می شد اطمینان نداشت ولی به ماشین ترجمه گوگل - بخاطر بی نظر بودنش- اعتماد دارد. ..نوشته: اکبر شیخ زاده- تورنتو-.....

منابع: نشریه رجیستر  ، گوگل بلاگ اسکوپ   ، مصاحبه با فرانز آوچ  ، مجله کریستین ساینس مانیتور



نظرات دیگران: نظر
لیست کل یادداشت های موجود در هم نوشت

دوستی کی آخر آمد دوستداران را چه شد
دوره ارزانیست !!!
[عناوین آرشیوشده]