حافظۀ ترجمه

حافظۀ ترجمه

حافظۀ ترجمه نوعی ابزار برای تسریع و تسهیل کار مترجم است.
حافظۀ ترجمه

حافظۀ ترجمه

حافظۀ ترجمه نوعی ابزار برای تسریع و تسهیل کار مترجم است.

ابزارهای کامپیوتری پشتیبان مترجم (CAT) --- قسمت سوم

روش دیگر برای ارتقای ترجمه، استفاده از کورپس های زبان های بین المللی است. چنین چیزی زمانی مهم است که از زبان مادری به زبان مقصد مبادرت به ترجمه می کنیم.

کورپس ها مجموعه ای از متون هستند که براساس اصولی خاص جمع آوری، انتخاب، و ساختار آن ها از لحاظ صرف و نحو تجزیه و تحلیل شده است، و دارای موتور جستجوی مخصوصند. اهمیت استفاده از کورپس ها برای مترجم در ذیل شرح داده شده است:

(1) کورپس ها نمونه هایی از جملات را از منابع گفتاری و نوشتاری گرد آورده اند (ادبیات، نوشته های علمی، مجلات و نشریات، گزارش های آکادمیک، و محاورات). زمانی که در مورد کاربرد صحیح واژه ها در یک کانتکست خاص شک داریم، کورپس ها مفید فایده خواهند بود؛

(2)  تمام متون ارائه شده در کورپس ها دارای داده های نمونه‌اند، زیرا تقریباً تمامی کورپس های مدرن شامل بیش از 100 میلیون واژه و ترکیب واژگانند؛

(3) کورپس ها قادرند بسیاری از مشکلات مرتبط با زبان شناسی را حل کنند، از جمله مشکلاتی که در حین ترجمه بروز می کنند.

با این حال، با وجود داشتن داده های نمونۀ حجیم و دقیق، کورپس ها نمی توانند تمامی زمینه های حرفه ای را پوشش دهند؛ این مساله کاربرد آن ها را در برخی شاخه های علمی غیرممکن می سازد.

 

محصولاتی که مبتنی بر نرم افزارهای «حافظه ترجمه» هستند، به منظور استفادۀ مترجمان و دارالترجمه ها طراحی می شوند.

 

ابزارهای پشتیبان مترجم مانند اس دی ال ترادوس، Déjà vu، استارترنزیت، وُردفست، و غیره در حال حاضر جزء جدایی ناپذیر فرآیند ترجمه هستند. اهمیت استفاده از آن ها زمانی نمایان می شود که قرار است یک پروژۀ بزرگ به وسیلۀ عدۀ زیادی مترجم انجام شود؛ در این مواقع، معادل هایی که گزینش می شوند می بایست در کل پروژۀ ترجمه انسجام داشته باشند. در نتیجه، ترجمه در یک پایگاه داده ذخیره شده و کلیۀ شرکت کنندگانْ در فرآیند آماده سازی پروژه به آن پایگاه دسترسی خواهند داشت. مترجمان قادرند به شکل محلی و یا از راه دور به شبکه ای واحد متصل شوند. چنین مساله ای برای شرکت هایی که دارای شعبه هایی در کشورهای مختلفند مهم تلقی می شود.

ادامه دارد ...

ابزارهای کامپیوتری پشتیبان مترجم (CAT) --- قسمت دوم


نویسنده: Ilya Ulitkin (استاد زبان شناسی دانشگاه مسکو، مترجم روسی به انگلیسی، ویراستار ژورنال الکترونیک کوانتومی)


ایدۀ ترجمه با پشتیبانی کامپیوتر (Computer-assisted translation) با ظهور کامپیوتر های اولیه مطرح شد: بسیاری از مترجمان مخالف ترجمۀ ماشینی بودند، که در بحث زبان شناسی کامپیوتری موضوع تحقیقات بسیاری بوده است، اما استفاده از کامپیوتر به عنوان میز کار مترجم مساله ای است که به شدت از آن حمایت کرده اند. 

در واقع، ایدۀ ترجمه با پشتیبانی کامپیوتر (CAT) اولین بار به وسیلۀMartin Kay مطرح شد. اظهارات وی در سال 1980 رویکردهای وقت در مورد ترجمۀ ماشینی را مورد انتقاد قرار داد، یعنی تولید سیستمی که هدف آن جایگزین کردن انسان با ماشین بود و یا در بهترین حالت تقلیل دادن نقش مترجم به ویراستار و یا ابزار آپدیت کردن فرهنگ‌های لغت. در عین حال، وی خواستار توسعۀ ابزارهایی شد که مترجمان با کمک آن‌ها به کار ترجمه بپردازند.

 

از آنجایی که در آن زمان هنوز ریزپردازنده‌ها و کامپیوترهای شخصی ابداع نشده بودند، ابزار کارْ شبکه ای از ترمینال‌ها بود که به یک مینفریم متصل می‌شدند.

 

اساس ایدۀ Kay این بود که ابزارهای واژه‌پرداز کنونی را می‌توان به تدریج با امکانات ترجمه ارتقا داد. در مرحلۀ اول یک ویراستارِ متن چندزبانه (multilingual) و یک ترمینال با صفحۀ دوپاره مورد نیاز بود؛ به چنین چیزی می بایست قابلیتی افزوده می شد تا اولاًبه شکل خودکار تمام کلمات و عبارات در فرهنگ لغت جستجو شوند، ثانیاًمعادل‌هایی که مترجم پیش از آن برای کلمات و عبارات در نظر گرفته بود کنترل شوند تا از انسجام متن اطمینان حاصل گردد. در نهایت، بخش‌هایی از متن به انتخاب خود مترجم به شکل خودکار به وسیلۀ ماشین ترجمه و مترجم آن را ویرایش کند و یا به شکل تعاملی چنین کاری انجام شود، یعنی کامپیوتر از مترجم درخواست رفع ابهام کند [4].

 

امروزه، معمول‌ترین کاربرد کامپیوتر در ترجمه استفاده از نرم افزارهایی است که اتوماسیون را در فرایند ترجمه تضمین می کنند، که عبارتند از:

(1) دیکشنری های الکترونیکی (آی فینگر، اَبی لینگوُ، کالینز-اُلترالینگوا، موبایل سیستم، پاراگون سافتور، و غیره) و کورپس های زبان های بین المللی (بریتیش نشنال کورپس، اَمریکن نشنال کورپس، راشن نشنال کورپس، کورپس پارالل انگلیسی - نروژی، و غیره)؛

(2) ابزارهای کامپیوتری پشتیبان مترجم (CAT tools) و یا نرم افزارهای «حافظۀ ترجمه» (اس ال دی ترادوس، ممو کیو، Deja vu، استار ترنزیت، وُردفست، و غیره)؛

(3) نرم افزارهای ادیتور (اسپل چکر، استایل رایتر، و غیره)

دیکشنری های الکترونیکی می توانند تک زبانه باشند و یا دو زبانه و حتی چند زبانه. به علاوه آن ها حاوی اطلاعاتی در مورد ترکیب کلمات، تلفظ (معمولا بوسیلۀ یک متکلم بومی بیان می شوند)، و کالوکیشن ها هستند. حتی ممکن است فرهنگ هایی را شامل شوند که به یک زمینۀ واحد (ریاضی، فیزیک، زیست شناسی، پزشکی، مذاهب، مهندسی، و غیره)، اصطلاحات، اسلنگ ها، و غیره اختصاص دارند.

تمامی دیکشنری های الکترونیکی را می توان به دو دستۀ آنلاین و آفلاین دسته بندی کرد. دیکشنری های آنلاین نیازمند دسترسی به اینترنت هستند، در حالی که دیکشنری های آفلاین را می توان روی کامپیوتر نصب و به شکل آفلاین استفاده کرد.

دامنۀ نرم افزارهای دیکشنری بسیار فراتر از دیکشنری های کاغذی است. بسیاری از ناشران سنتیِ فرهنگ لغت امکان استفاده از منابعشان را بر روی دسکتاپ و لپتاپ فراهم آورده اند. این برنامه ها را می توان دانلود کرد و یا به شکل سی دی خریداری و نصب کرد. برخی از ناشران تخصصی نیز اقدام به تولید نرم افزارهای الکترونیکی می کنند، مانند آی فینگر، اَبی لینگوُ، کالینز-اُلترالینگوا، موبایل سیستم، پاراگون سافتور. برخی دیکشنریهای الکترونیکی فراهم کنندۀ فوروم گفتگوی آنلاین برای زبان شناسان هستند [5].

از جمله خصوصیات دیکشنری های آنلاینْ ساده بودن، پردازش سریع اطلاعات، امکان کپی و پیست کردن واژۀ جستجو شده، و سایر توانمندی های آن هاست. با این حال، برخی دیکشنری های آنلاین بر پایۀ اصول «ویکی» استوارند؛ به این معنا که کاربران می توانند آن ها را آپگرید کنند. یکی از نمونه های آن Urban Dictionary است [6].

با وجود این، به گفتۀ B. Osimo خصوصیت آپگرید شدن مداومْ نقطۀ ضعف محسوب می شود: متن چاپ شده معمولا دقیق تر است؛ پیش از آنکه هزینه ای صرف نشر کاغذی شود، نویسنده ها و ناشران تلاش می کنند تا محصولی قابل قبول ارائه دهند. همانطور که همه می دانند، با کمک اینترنت هر کسی می تواند برای خود یک سایت اینترنتی داشته باشد (به شرط آنکه قوانین ملی و بین المللی را نقض نکند)، حتی بدون مشاور، ویراستار، و یا ناشر [7].


در نتیجه، نگرش زبان شناسان به دیکشنری های الکترونیکی، شکاکانه است، زیرا استفاده از آن ها ممکن است کیفیت ترجمه را پایین آورد.

 

با این حال، مزایای دیکشنری های آنلاین روشن است.


اول، آن ها به اندازۀ دیکشنری های چاپی محافظه کار نیستند، زیرا می توان آن ها را به شکل پیوسته آپگرید کرد. چنانچه با علومی سر و کار داشته باشیم که مدام در حال پشرفتند (مانند مخابرات، نانوتکنولوژی، کامپیوتر، و غیره)، چنین مساله ای اهمیت می یابد. دیکشنری های چاپی مدت کوتاهی پس از انتشار منسوخ خواهند شد، و تنها راهی که می توان همگام با پیشرفت های فنی حرکت کرد استفاده از دیکشنری های آنلاین است.


دوم، دیکشنری‌های الکترونیکی دسترسی کاربران را به منابع زبان شناسی تسهیل می‌کنند و می‌توان چنین اطلاعاتی را به سرعت نه تنها در دیکشنری بلکه در اینترنت جستجو کرد. برای مثال، نسخۀ چاپی دیکشنری آکسفورد دارای 12 جلد است، و یافتن واژۀ مورد نظر کار آسانی نخواهد بود، در حالی که می‌توان همان واژه را ظرف چند ثانیه در نسخۀ کامپیوتری پیدا کرد.


سوم، تمامی دیکشنری های الکترونیکی دارای آپشنی هستند که به کاربر اجازه می دهد واژه های خود را به آن اضافه کرده و از این طریق نسخۀ اصلی ارتقا می یابد.


چهارم، دیکشنری های الکترونیکی دوزبانه و چندزبانه در هنگام ترجمه امکان تغییر زبان را بین جفت های زبانی میسر می کنند [2].

 

 

ادامه دارد ...

(این مقاله در سه الی پنج قسمت تهیه شده و روزهای یک شنبه مابین ساعت 22 الی 24 منتشر می شود.)

ابزارهای کامپیوتری پشتیبان مترجم (CAT) --- قسمت اول


نویسنده: Ilya Ulitkin (استاد زبان شناسی دانشگاه مسکو، مترجم روسی به انگلیسی، ویراستار ژورنال الکترونیک کوانتومی) 


مترجم: مدیر وبلاگ


تا دو سه دهۀ پیش، گسترۀ ابزارهای کاری مترجم از یک دستگاه تایپ و مجموعه ای از دیکشنری‌های چاپ شده فراتر نمی‌رفت، که استفاده از آن‌ها زحمت چندانی نداشت. با وجود این، در پی پیشرفت فزایندۀ سخت افزارهای الکترونیکی و نرم افزارهای کامپیوتری، توانایی تکنولوژیکی به یکی از مؤلفه های لازم حرفۀ ترجمه تبدیل شده است، که، اول از همه، مهارتِ استفاده از منابع و ابزارهای الکترونیکی را می‌طلبد [1].


اکنون، هنگامی که عبارت «ابزارهای کاری مترجم» به گوشمان می‌خورد، اولین تصویری که در ذهنمان نقش می‌بندد یک کامپیوتر شخصی و اینترنت است. هیچ مترجمی به سبک و سیاق سی و یا چهل سال پیش ترجمه نمی‌کند؛ زیرا، دیکشنری‌های الکترونیکی، نرم افزارهای ترجمه، و منابع اینترنتی در دسترس است، که امکان به روز بودن را در اختیار ما قرار می‌دهد. چنین چیزی زمانی مهم می‌نماید که باور کنیم تقریباً تمام مترجمان از اینترنت و سایر ابزارهای الکترونیکی در کار خود استفاده می‌کنند [2].


علی رغم کارایی و چشم انداز، نرم افزارهای ترجمه و ابزارهای الکترونیکی نمی‌توانند جایگزین ترجمه انسانی شوند و ترجمه های با کیفیت ارائه دهند.


ایدۀ ترجمۀ ماشینی را می‌توان در قرن هفدهم جستجو کرد. در سال 1629، رنه دکارت پیشنهاد یک زبان جهانی را مطرح ساخت؛ چنین زبانی دارای ترکیب‌هایمشابه در زبان‌های مختلف با یک سری سمبل مشترک بود. با وجود این، سیر تکامل ترجمه ماشینی از دهۀ 1940 آغاز شد، زمانی که اولین کامپیوترهای الکترونیکی طراحی شدند. در مارس 1949، وارد ویور، سرپرست علوم طبیعی در بنیاد راکفلر، مفهوم ترجمۀ ماشینی را تدوین کرد؛ وی تحت تأثیر روشی قرار گرفته بود که در آنْ بریتانیایی‌ها با استفاده از کامپیوترهای غول پیکر کد¬هاینظامی ماشین‌های رمزنگاری آلمان را رمزگشایی می‌کردند. وی اظهار داشته است، «من متنی به زبان روسی پیش روی خود دارم. اما فرض می‌کنیم با یک سری سمبل نامفهوم [اما مشترک در تمام زبان‌ها] نوشته شده است. تنها کاری که می‌بایست انجام دهم این است که کدها را رمزگشایی کنم تا اطلاعاتی که در متن وجود دارد بازیابی شود.»


اظهارات ویور علاقۀ افراد زیادی را به ترجمۀ ماشینی برانگیخت، به خصوص نظامیان. آن‌ها اولین افرادی بودند که از ابداع نرم افزار ترجمۀ ماشینی حمایت کردند. در ایالات متحده، ترجمۀ روسی به انگلیسی مقبولیت فراوانی داشت، در حالی که در اتحاد جماهیر شوروی، چنین توجهی به ترجمۀ انگلیسی به روسی معطوف می‌شد.


امروزه، سه رویکرد در مورد ترجمۀ نوشتاری وجود دارد: اول، ترجمۀ ماشینی بر اساس قواعد زبان مقصد و مبدأ؛ دوم، ترجمۀ ماشینی آماری؛ و سوم، ترجمه با کمک کامپیوتر.


ابتدایی‌ترین «موتورهای ترجمه» در ترجمه های ماشینی همگی مبتنی بر رویکرد مستقیم و «تبدیلی» بودند. جملات ورودی زبان مبدأ، با استفاده از شکل ساده ای از parsing، مستقیماً به جملات خروجی زبان مقصد تبدیل می‌شدند. پارسرها، با تقسیم جمله به فاعل، مفعول، فعل، و غیره، جملۀمبدأ را به شکل کامل تحلیل می‌کردند.در ادامه، کلمات مبدا با کلمات موجود در دیکشنری جایگزین و با توجه به قواعد زبان مقصد مرتب می شدند. این رویکرد مدت ها استفاده شد و در نهایت با رویکردی دیگر جایگزین شد، که «دانش زبان شناسی» نامیده می شود. کامپیوترهای مدرن، که قدرت پردازش بیشتر و حافظۀ بالاتری دارند، قادرند کاری را که در دهۀ 1960 محال بود، انجام دهند. ترنسلیتورهای دارای رویکرد «دانش زبان شناسی» دارای دو مجموعه قواعد گرامری اند: مجموعه ای برای زبان مبدا و مجموعه ای برای زبان مقصد. به علاوه، کامپیوترهای مدرن نه تنها گرامر زبان مقصد (ساختار مورفولوژیک و syntactic)، بلکه اطلاعات معنایی را نیز تحلیل می کنند. آن ها اطلاعاتی دربارۀ تفاوت های اصطلاحی زبان ها دارند، که مانع از بروز اشتباهات به اصطلاح احمقانه می شود. با وجود این، فضا برای پیشرفت زیاد است.


رویکرد دوم مبتنی بر روش آماریست: از طریق آنالیز حجم عظیمی از متون موازی (مقایسۀ متن های ترجمه شده و متن های مبدا)، برنامه متغیرهایی را که بیشترین شباهت را به هم دارند گزینش کرده و آن ها را در ترجمه استفاده می کند. این رویکرد از قواعد گرامری استفاده نمی کند؛ زیرا، الگوریتم آن بر مبنای تحلیل آماری است نه تحلیلِ مرسومِ مبتنی بر قواعد. به علاوه، واحدهای زبانی که در این رویکرد از آن ها استفاده می شود ترکیب کلمات است، نه کلمات تفکیک شده. یکی از نمونه های مشهور این روشْ «گوگل ترنسلیت» است، که مبتنی بر رویکرد ترجمۀ ماشینی آماریست؛ این ابزار بیش از همه مرهون تحقیقات Franz-Josef Och است که در سال 2003 برندۀ جایزۀ DARPA برای ترجمۀ پرسرعت ماشینی شد. بر اساس سخنرانی وی، که در اجلاس ترجمۀ ماشینی 2003 مطرح شد، برای ابداع سیستم های ترجمۀ ماشینی آماری قابل کاربردْ به پایگاهی نیاز است که دارای کورپسی دوزبانه (و یا مجموعه ای موازی هم) حاوی بیش از یک میلیون کلمه است و همچنین چنین پایگاهی باید دارای دو کورپس تک زبانه با بیش از یک میلیارد کلمه باشد. سپس، مدل های آماری که از این داده ها استخراج می شوند می توانند بین دو زبان به ترجمه بپردازند. با وجود این، جملات ترجمه شده برخی اوقات به قدری بی ربط هستند که درک آن ها غیر ممکن است. 


ترجمه با کمک کامپیوتر (Computer-assisted translation) رویکردی کاملاً متفاوت است. بر اساس «ویکی‌پدیا»، ترجمه با کمک و یا پشتیبانی کامپیوتر (CAT) شکلی از ترجمه است که در آن مترجم با استفاده از نرم افزارهای کامپیوتری که برگردان متون را پشتیبانی و آن را تسهیل می‌کنند، به کار ترجمه می‌پردازد [3]. 


ادامه دارد ...