هیچ کس از آنها یادی نمیکند ولی به جرأت میتوان گفت که مترجمان از افراد بسیار مؤثر تاریخ هستند. ترجمه آثار ادبی، علمی و فلسفی ملل دیگر سرآغاز تحولات عظیمی در تاریخ بودهاند. از جمله این موارد میتوان به ترجمه آثار یونانیان باستان به زبان عربی و ترجمه آثار مسلمانان به زبانهای اروپایی اشاره کرد. تا پیش از اختراع صنعت چاپ، تعداد آثار نوشتاری بسیار محدود بود و به طبع آن، تعداد مترجمین هم کم بود. اما انقلابی که صنعت چاپ به پا کرد، موجب شد که تعداد مترجمین به سرعت افزوده شود و افراد زیادی به یادگیری زبانهای دیگر بپردازند تا جایی که وجود افراد دوزبانه به امری عادی بدل گردید و ترجمه تبدیل به یک رشته دانشگاهی شد.
میدانیم که امروزه کار از چاپ و نشر گذشته است و با انقلاب دیجیتال روبرو هستیم. کامپیوترها به تمامی زمینههای زندگی ما وارد شدهاند و همه چیز را خودکار کردهاند. حال سؤال اینجاست که آیا کامپیوترها میتوانند ترجمه هم بکنند؟ پاسخ به این سؤال مثبت است. در حال حاضر سایتهای زیادی وجود دارند که عمل ترجمه را انجام میدهند. یکی از معروفترین نمونههای آن، ترجمه گوگل است. سرویس ترجمه گوگل به آدرس translate.google.com یک سرویس رایگان است و برای استفاده از آن نیاز به ساخت اکانت هم نیست.
در این نوشتار قصد داریم نگاهی به سرویس ترجمه گوگل بیندازیم و ببینیم که عملکرد این سیستم ترجمه چگونه است و در آینده به چه شکل خواهد بود.
ترجمه گوگل چگونه کار میکند؟
در علم کامپیوتر مبحثی وجود دارد به نام ترجمه ماشینی یا Machine Translation. دانشمندان علم کامپیوتر به دنبال تولید برنامههایی هستند که بتواند با کیفیتی معادل یک مترجم انسانی، متون را ترجمه کنند. تلاشهای دانشمندان موجب به وجود آمدن چندین روش برای ترجمه ماشینی شده است:
1. روش مستقیم
در روش مستقیم، ماشین کلمه به کلمه بر روی متن مبدأ حرکت کرده و هر کلمه را به کلمه معادل در زبان مقصد ترجمه میکند. ایده اصلی این روش اینست که متن مبدأ به صورت تدریجی به متن مقصد ترجمه شود. این روش دیگر مورد استفاده قرار نمیگیرد زیرا کیفیت ترجمه در این روش بسیار پایین است ولی ایده آن پایه و اساس سایر روشهای ترجمه را تشکیل میدهد.
2. روش انتقالی
زبانها علاوه بر تفاوت در کلمات، در ساختارهای نحوی هم با یکدیگر متفاوتند. در روش انتقالی به این تفاوت توجه میشود و ساختار جمله مبدأ به ساختار زبان مقصد تبدیل میگردد. روشهای انتقالی غالباً سه مرحله دارند: مرحله تحلیل، مرحله انتقال و مرحله تولید.
پس از اینکه درخت اشتقاق جمله مبدأ به دست آمد، از قوانین انتقالی نحوی و لغوی استفاده میشود. قوانین نحوی درخت اشتقاق زبان مبدأ را به درخت اشتقاق زبان مقصد تبدیل میکنند. قوانین انتقال لغوی همانند روش مستقیم کلمات را به زبان مقصد ترجمه میکنند.
در برخی موارد از ترکیب دو روش مستقیم و انتقالی استفاده میشود. به عنوان مثال روش ارائه شده در سیسترن، شامل مراحل زیر است:
– تحلیل
- تحلیل ریختشناسی و تعیین نقش دستوری لغات
- خرد کردن عبارات اسمی و فعلی
- ایجاد درخت اشتقاق با استفاده از روش وابستگی
– انتقال
- ترجمه اصطلاحات
- رفع ابهام لغات
- تخصیص پیشوندهای مناسب به افعال
– تولید
- استفاده از دیکشنری غنی شده دو زبانه که در آن اطلاعات نحوی هم گنجانده شده است.
- اصلاح ترتیب لغات
- تولید ریختهای صحیح
این روش همانند روش مستقیم، به دیکشنری دوزبانه وابسته است. دیکشنری که در این روش استفاده میشود حاوی اطلاعات نحوی و معنایی هم میباشد. شباهت دیگر این روش به روش مستقیم، در تصحیح ترتیب لغات در مرحله پیشپردازش است. از طرف دیگر در تمامی مراحل روش سیسترن، همانند روش انتقالی، اطلاعات نحوی گنجانده شده است.
3. روش زبان میانی
اشکال روش انتقالی اینست که برای هر جفت زبان، نیازمند یک مجموعه جدا از قوانین انتقال نحوی هستیم. در شرایطی که نیاز به ترجمه بین زبانهای مختلف باشد، استفاده از این روش چندان بهینه نیست. ایده روش زبان میانی اینست که به جای ترجمه کلمه به کلمه، ابتدا مفهوم جملات زبان مبدأ استخراج شده و در قالبی مشخص ریخته شود. به این قالب مشخص، زبان میانی میگویند. در مرحله بعد مفاهیم از زبان میانی به زبان مقصد ترجمه میشوند.
چالش اصلی در این روش استخراج مفاهیم و انتخاب شیوه صحیح نمایش آنهاست. یعنی باید زبان میانی به درستی انتخاب شود. به همین دلیل روش زبان میانی از دو روش قبلی تحلیل بیشتری نیاز دارد. این روش ایراداتی هم دارد. به عنوان مثال زمانی که دو زبان شبیه به یکدیگر بوده و مفاهیم مشترک زیادی داشته باشند، تبدیلات غیرضروری فراوانی انجام میشود. همچنین این روش تنها در حوزههایی که آنتولوژی پیچیدهای ندارند قابل استفاده است. مانند رزرو هتل، پیشنهاد رستوران و غیره.
4. ترجمه ماشینی آماری
ترجمه ماشینی آماری بهترین روش ترجمه ماشینی است که ارائه شده است. در این روش دو دسته متن وجود دارد. دسته اول به زبان مبدأ و دسته دوم به زبان مقصد. این مجموعه در اختیار کامپیوتر است. هر گاه کامپیوتر بخواهد متن جدیدی را ترجمه کند، کل متونی که ترجمه آنها را دارد را جستجو کرده و سعی میکند عباراتی مشابه با عباراتی که در متن جدید هست را بیابد. بدین ترتیب با بررسی دفعات تکرار هر ترجمه و قوانین آمار و احتمالات، بهترین معادل را برای هر عبارت یا جمله مییابد. مشخص است که هر چقدر متونی که به عنوان راهنما در اختیار کامپیوتر قرار دارد بیشتر باشند، نتیجه کار بهتر خواهد بود.
روش ترجمه گوگل کدام است؟
گوگل در سال 2006 سرویس ترجمه خود را راهاندازی کرد و از همان ابتدا، روش ترجمه آماری را برگزید. این یعنی که ترجمه گوگل هیچ درکی از دستور زبان مبدأ و مقصد ندارد. ترجمه گوگل در مجموعه متونی که در دسترسش است جستجو کرده و با قوانین آمار و احتمال، بهترین ترجمه را برای هر عبارت یا جمله مییابد. مثلاً فرض کنید عبارت I want to go to the bank to get some money را به ترجمه گوگل دادهاید. کلمه bank در زبان انگلیسی دو معنا دارد. یکی ساحل رودخانه و دیگری بانکی که در آن پول میریزید. در اینجا ترجمه گوگل با جستجو در متونی که در اختیارش است، در مییابد که هر گاه کلمه bank با money همراه باشد، به احتمال زیاد باید بانک ترجمه شود و نه ساحل رودخانه. بدین ترتیب ترجمه صحیح را انجام میدهد.
حتماً سؤال میپرسید که چه متونی در اختیار ترجمه گوگل است؟ رئیس سابق بخش ترجمه گوگل بیان میکند که برای اینکه یک مترجم آماری خوب داشته باشیم، باید دو مجموعه متن با 150 تا 200 میلیون کلمه است که یک مجموعه باید ترجمه مجموعه دیگر باشد. گوگل این متون را از سازمان ملل گرفته است. سازمان ملل تمامی بیانیهها و اسناد مهم خود را به شش زبان منتشر میکند. این اسناد و مدارک پایه و منبع مترجم آماری گوگل هستند. به همین دلیل است که کیفیت ترجمه گوگل بین زبانهای اروپایی بسیار بالاست.
نکته جالب دیگر اینکه ترجمه گوگل در بیشتر موارد مستقیماً عمل ترجمه را انجام نمیدهد، بلکه ابتدا متن را از زبان مبدأ به انگلیسی ترجمه کرده و سپس آن را به زبان مقصد ترجمه میکند.
چرا ترجمه گوگل مثل مترجم انسانی نمیشود؟
این سؤالی که در ذهن خیلی از افراد وجود دارد. چرا ترجمه گوگل اینقدر بد است و خیلی از اوقات پرت و پلا تحویل میدهد؟ اگر مطالب را بالا را مطالعه کرده باشید، جواب این سؤال را خواهید یافت. حقیقت اینست که ترجمه گوگل هیچ درکی از متن ندارد. مفهوم کلی را درک نمیکند. تنها کاری که این مترجم انجام میدهد، جستجو در یک سری متون ترجمه شده است. ترجمه گوگل در تمام متونی که در اختیارش است میگردد و با بررسی موارد بسیار زیادی، نزدیکترین ترجمه برای متن ورودی شما را پیدا میکند. البته این جستجو هم با کمک الگوریتمهای پیچیدهای انجام میشود و به هیچ عنوان کار راحتی نیست ولی به هر حال ترجمه گوگل درکی از مفهوم متن ندارد.
این در حالی است که یک مترجم انسانی خوب ابتدا متن را میخواند، درک میکند و سپس نزدیکترین کلمات و جملات زبان مقصد را برای ترجمه برمیگزیند. بسیاری از دانشمندان علم کامپیوتر معتقدند تا زمانی که مسأله فهم زبان برای کامپیوترها حل نشود، امکان دستیابی به ترجمه ماشینی با کیفیت وجود ندارد و باید به همین ترجمههای کلی و درهم بسنده کرد.
اما یک خبر خوب هم داریم. در سپتامبر 2016، تیم ترجمه گوگل اعلام کردند که روش جدیدی برای ترجمه ماشینی ابداع کردهاند که میتواند با کیفیت بالاتری متون را ترجمه کند. اگر پیگیر اخبار فناوری باشید، حتماً میدانید که گوگل مدتی است چندین پروژه موفق در زمینه هوش مصنوعی به راه انداخته است. نمونه مشهور و پر سر و صدای آن، هوش مصنوعی بود که قهرمان بازی GO را شکست داد.
پایه همهی این پروژهها، فناوری است به نام یادگیری عمیق. توضیحات فنی این فناوری از حوصله این مقاله بیرون است و نیازمند دانش زیادی در زمینه هوش مصنوعی و شبکههای عصبی است. فقط در همین حد بدانید که این فناوری میتواند سطوح بالایی از انتزاع را درک کند. یعنی چه؟ یعنی اینکه اگر یک عکس را به هوش مصنوعی گوگل بدهید. ابتدا نقاط را شناسایی میکند. سپس خطوط را درک میکند، سپس اشکال هندسی ساده را مییابد. با قرار دادن اشکال هندسی ساده به اشکال پیچیده میرسد و در نهایت کل یک تصویر را درک میکند.
آینده ترجمه گوگل در دست همین فناوری است. امید است که این فناوری بتواند مفهوم عبارات، جملات یا حتی پاراگرافها را هم درک کند. در این سیستم هم ابتدا کامپیوتر میلیونها متن ترجمه شده را بررسی میکند. در این بررسی به صورت خودکار فن ترجمه و مفهوم جملات را در مییابد و در نهایت کل یک جمله را ترجمه میکند.
این سیستم جدید در حال حاضر ترجمه بین انگلیسی و زبانهای اسپانیایی، فرانسوی و چینی را انجام میدهد. افرادی که به هر دوی این زبانها مسلط بودهاند، عملکرد سیستم جدید ترجمه گوگل را ارزیابی کرده و در بسیاری از موارد آن را معادل با مترجم انسانی دانستهاند.
کلام آخر
هنر و فن ترجمه در طول تاریخ پل میان تمدنها بوده است. کاری که یک سیستم ترجمه ماشینی خوب با تمدن بشر میکند، فراتر از هر تصور است. به این بیاندیشید که هر مقاله علمی و صفحه اینترنتی را بتوانید به زبان فارسی روان بخوانید و هر فیلمی را زیرنویس فارسی ببینید. امید است که فناوری جدید ترجمه گوگل بتواند شروعی برای قدم نهادن در این راه باشد.