PDA

View Full Version : جمع آوري داده براي ماشين ترجمه فارسي-انگليسي



aminfarajian
شنبه 21 فروردین 1389, 23:05 عصر
با سلام خدمت دوستان عزيز.
من چند وقته كه دارم روي ماشين ترجمه فارسي-انگليسي كار ميكنم. همه مقدمات كار رو انجام دادم. كد برنامه به صورت كامل نوشته شده و با استفاده از داده هاي مختلفي (حتي براي زبان انگليسي-فرانسه) تست شده.
من براي ساخت اين ماشين ترجمه از متد آماري (Statistical Machine Translation) استفاده كردم كه در حال حاضر يكي از بهترين متدها براي ترجمه محسوب ميشه. (Power Translator و مترجم Google هم از اين متد استفاده ميكنن)
شيوه كار به اين صورته كه ما ابتدا بايد حجم عظيمي از متون رو به همراه ترجمه اونها به عنوان ورودي به سيستممون بديم. سيستم باستفاده از اين داده ها يك سري مدلها رو استخراج ميكنه و ياد ميگيره كه چطور بايد متون رو ترجمه كنه. از اين به بعد هر جمله اي كه به اون داده بشه رو با دقت بالايي ترجمه ميكنه. خوبي اين روش اينه كه به زبانهاي مبدا و مقصد وابسته نيست و براي هر جفت زباني قابل استفاده است. تنها نكته اي كه داره اينه كه براي ترجمه متون از زبان a به b بايد ابتدا حجم عظيمي از جملات به زبان a رو به همراه ترجمه اونها در زبان b گير بياريم و به عنوان ورودي به سيستم بديم. به اين حجم عظيم جملات (بيش از 100 هزار جمله) پيكره يا Corpus ميگن.

براي بسياري از زبانها مثل اسپانيايي، فرانسه، آلماني، ايتاليايي، حتي عربي پيكره هاي خوب و ارزشمندي وجود داره كه حتي بعضي هاشون رو مجاني ميشه از اينترنت دانلود كرد. اما براي فارسي متاسفانه چنين چيزي وجود نداره يا اينكه حداقل من در طي اين 2، 3 سال نديدم.

كاري كه من قصد دارم الان انجام بدم و از شما هم براي انجامش كمك ميخوام اينه كه يه پيكره فارسي-انگليسي براي استفاده در ماشين هاي ترجمه آماري بسازيم. براي اينكار از دوستان تقاضا مي كنم هر كسي كه متن ترجمه شده اي داره لطف كنه و اون رو (متن اصلي به همراه ترجمش) براي ما بفرسته. به اميد خدا قصد دارم در صورت به اتمام رسيدن موفقيت آميز اين پروژه، پيكره بدست اومده رو در اختيار علاقمندان قرار بدم تا بتونن به راحتي از اون استفاده كنن.

اگه كسي اطلاعات بيشتري خواست بنده در خدمتم.

amir_saniyan
یک شنبه 22 فروردین 1389, 14:02 عصر
سلام
یک راه حل ساده اش استفاده از سرویس ترجمه فارسی گوگل هست.
شاید اینطوری بشه داده تولید کرد :)
موفق باشید.

dousti_design
یک شنبه 22 فروردین 1389, 14:26 عصر
من چند ماه پیش به فکر نوشتن یک دیکشنری افتادم و اولش که یکم فکر کردم(بدون هیچ مطالعه و تحقیقی) چیزی که به نظرم رسید تقریبا همینی بود که شما گفتید. فکر من این بود که وقتی یکی یه جمله دو کلمه ای رو میخواد ترجمه کنه و توی این جمله، کلمه اول یکی و کلمه دوم چندتا معنی داره. کاری که میخواستم بکنم این بود که کلمه اول رو یه بار با معنی اول کلمه دوم توی اینترنت(با استفاده از موتورهای جستجوگر) جستجو کنم و ببینم چندبار توی کل وب این دو کلمه کنار هم مورد استفاده قرار گرفته اند. و بعد معنی کلمه اول به همراه معنی دوم کلمه دوم و...
و همینطور ادامه بدم تا آخر. و در آخر هم معنی که بیشتر توی وب دیده شده رو به عنوان جواب قرار بدم.
نمیدونم شاید فکر خوبی باشه. (خودم فرصت نکردم والا حتما انجامش میدادم.
موفق باشید!

aminfarajian
یک شنبه 22 فروردین 1389, 17:51 عصر
سلام دوستان
قضيه خيلي پيچيده تر از اين حرفاس.
بذاريد يه كم بيشتر در مورد شيوه عملكرد ماشين هاي مترجم توضيح بدم شايد كسي بتونه كمك كنه. البته قبلش بگم كه موضوع پروژه ارشد خود من ماشين ترجمه بوده و من خودم يه ماشين ترجمه نوشتم كه خيلي خوب هم كار ميكرد و جواب ميداد. براي نوشتنش هم از متدي استفاده كردم كه هيچ گونه وابستگي به زبان هاي مبدا و مقصد نداشت و به راحتي براي هر جفت زباني قابل استفاده بود. زماني كه ميخواستم سيستم رو تست كنم هر چي گشتم نتونستم يك پيكره براي زبان فارسي پيدا كنم بنابراين ناچار شدم كه سيستمم رو روي زبان هاي فرانسه-انگليسي تست كنم.
پارسال اين كار رو انجام دادم و تموم شد. اما حالا ميخوام كارم رو گسترش بدم و روي زبان فارسي هم تستش كنم. براي اين منظور نياز به يه مجموعه آموزشي دارم.
حالا بزارين يك مقدار در مورد شيوه كار ماشين ترجمه ها بگم.
براي ساخت يه ماشين ترجمه، ابتدا بايد حجم عظيمي از جملات به زبان مبدا (مثلا فارسي) به همراه ترجمه اونها (مثلا انگليسي) رو به عنوان ورودي به سيستم بديم. (به اين مجموعه اصطلاحا پيكره يا Corpus) گفته ميشه. براي يه سيستم آزمايشي كه جوابهاي قابل قبولي توليد كنه معمولا بايد بيش از 100 هزار جمله داشته باشيم.
اين جملات توي دو تا فايل ذخيره ميشن. يكي از فايل ها حاوي جملات به زبان مبدا (Fa) و ديگري جملات به زبان مقصد (En). محتويات اين فايل ها بايد خط به خط با هم متناظر باشه يعني ترجمه جمله اول (در فايل Fr) بايد در خط اول فايل مقصد (En) باشه.
با استفاده از اين جملات و ترجمه اونها، سيستم مياد و دو مدل رو استخراج ميكنه: مدل زبان و مدل ترجمه. تا اينجا سيستم مرحله آموزش رو پشت سر گذاشته و از اين به بعد آمادس كه براي ترجمه متون جديد (در اين مثال فارسي به انگليسي) استفاده بشه.

خوب اين هم از يه مقدمه در مورد ماشين هاي ترجمه موجود.
اما برگرديم سر اصل مطلب. همونطور كه گفتم من در 2، 3 سال اخير هر چي گشتم نتونستم يه پيكره خوب براي زبان فارسي پيدا كنم. اما بر عكسش تا دلت بخواد براي زبان هاي ديگه ميشه پيكره پيدا كرد. حتي بعضي هاشون مجاني بودن كه خودم هم از چندتا از اونا استفاده كردم. يكي از محقق هاي مطرح توي اين زمينه اومده بود و سخنرانيهاي اجلاس اتحاديه اروپا رو (متن انگليسيشون به همراه ترجمه اون سخنرانيها به چندين زبان) جمع آوري كرده بود و به طور مجاني گذاشته بود روي سايتش كه من دانلود كردم و استفاده كردم. حجم اون پيكره در حدود يك و نيم گيگابايت بود.
حالا من دنبالش هستم كه چنين چيزي براي زبان فارسي توليد كنم. براي اين منظور از دوستان ميخوام كه لطف كنن و اگه متن ترجمه شده اي دارن بذارن روي سايت يا اگه آشنايي دارن كه تو كار ترجمس و تمايل داره همكاري كنه معرفي كنن.
اگر هم كسي خواست كارآموزيش رو توي اين زمينه بگذرونه ما يه شركت داريم كه ميتونه بياد اينجا و روي اين موضوع كار كنه.
(ناگفته نمونه كه از اين كار به اميد خدا چند تا مقاله هم درمياد كه اگه كسي تمايل به همكاري جدي داشته باشه و ما رو در اين پروژه كمك كنه اسمش در مقاله حتما خواهد بود)

SAASTN
یک شنبه 22 فروردین 1389, 22:21 عصر
خیلی خوشحال شدم که بالاخره یه جا دیدیم تو این مملکت یه نفر داره روی این موضوع پر اهمیت کار می کنه. و از این بابت از شما خیلی تشکر می کنم. چون رو این google نه میشه حسابی باز کرد و از طرفی اون هم دنبال مقاصد خوشه. و قبلا عذرخواهی می کنم که توی زمینه ای که فرمودید نمی تونم کمکی بکنم.

با توجه به آموزش پذیر بودن این شیوه احتمالا میشه ماشین رو برای ترجمه متون خاص تربیت کرد؟ و از طرفی ماشینی که مثلا بیشتر با متون کامپیوتری آموزش دیده در ترجمه متون شیمی با مشکل مواجه میشه؟
شما با ترجمه به شیوه تبدیل به زبان گشتاری چامسکی هم آشنا هستید؟ اون روش رو چطور ارزیابی می کنید؟ تا اونجا که یادم میاد اون روش هم در گام آخرش برای انتخاب معادل مناسب از روشی مشابه توضیحات شما استفاده می کرد.

aminfarajian
پنج شنبه 26 فروردین 1389, 12:42 عصر
با سلام به شما دوست عزيز.
ممنون از لطف شما.
همونطور كه فرموديد اين شيوه آموزش پذيره و در هر زمينه اي كه آموزش ببينه متون توي اون زمينه رو بهتر ميتونه ترجمه كنه. دقيقا مثل مترجم انساني. در مورد انسان هم اگه دقت كرده باشين كسي كه فقط متون مثلا شيمي رو ترجمه ميكنه، نميتونه متون مثلا ادبيات رو به خوبي ترجمه كنه.

در مورد زبان گشتاري چامسكي كه هم فرموديد بايد بگم كه اون هم يكي از شيوه هاي خوب ولي پرهزينه براي آموزش سيستمه. چون بايد قوانين تبديل رو براش تعريف كنيم كه در اين صورت مترجم ما به زبان وابسته ميشه و اگه بخوايم زبان مبدا يا مقصد رو عوض كنيم بايد اين مرحله رو براي اون زبان انجام بديم.
البته ناگفته نمونه كه تا اونجايي كه ميدونم اگه اين دو شيوه (آماري و گشتاري) رو با هم تركيب كنيم به نتايج بهتري ميرسيم.

كسي آشنايي يا دوستي نداره كه توي كار ترجمه باشه؟ تا اونجايي كه ميدونم روزنامه ها تعدادي مترجم دارن اما من نتونستم آشنايي اونجا پيدا كنم. كسي در اين زمينه نميتونه كمك كنه؟

aminfarajian
دوشنبه 30 فروردین 1389, 13:31 عصر
با سلام مجدد.
كسي سايتي ميشناسه كه مطالبش رو به چند زبان منتشر كنه؟ خودم بعضي از سايتهاي خبري رو ميشناسم ولي اون سايتها معمولا يك بخش مجزا براي نوشتن اخبار فارسي دارن، يك بخش هم واسه اخبار خارجي. به اين معني كه مطالبشون ترجمه نميشه بلكه به هر زباني كه مد نظرشونه از اول مينويسن.
كسي در اين مورد ميتونه راهنماييم كنه؟

negin2000
دوشنبه 19 اردیبهشت 1390, 11:35 صبح
من در زمینه مورد نظر شما ( سیستم ترجمه ماشینی از زبان فارسی به زبان مقصد ) کار می کنم ، همانطوریکه اطلاع دارید برای ایجاد ماشین ترجمه روشهای مختلفی از جمله Rule Based و Example Based وجود دارد که از نوشته های شما مشخص است که شما در حال انجام پروژه به روش Example Based می باشید . تا جائیکه من اطلاع دارم در این روش corpus شما حداقل باید در حدود یک میلیون جمله را شامل باشد که برای زبان فارسی این غیر ممکن است چون کسی تا به حال این کار را نکرده و برای جمع آوری چنین پیکره ای یک کار تیمی با فرصت حداقل یک ساله لازم است بنا براین در مرحله اول می توان برای حل مشکل از روش Rule Based استفاده نمود ( کاری که من در حال انجام آن هستم ) هر چند این روش هم مشکلات خاص خود را دارد از جمله پیدا کردن قوانینی که نشان دهنده ارتباط بین اسامی ( صفت ، اسم ، صفت نسبی ، مضاف و مضاف الیه و .... ) در زبان فارسی باشد با توجه به این که Short vowel ها در فارسی نوشته نمی شوند . اگر در این رابطه سئوال یا پاسخی داشتید آماده شنیدن هستم .

aminfarajian
سه شنبه 20 اردیبهشت 1390, 15:23 عصر
با سلام خدمت شما دوست عزیز
با دقت در تاریخ ارسال اولین پست متوجه خواهید شد که بیش از 1 سال از این موضوع میگذره ولی برام بسیار جالبه که بعد از این همه مدت شما جواب دادین.
در مورد روشهای ترجمه ماشینی باید خدمتتون عرض کنم که علاوه بر مواردی که شما ذکر کردید، روشی هم تحت عنوان ترجمه آماری وجود داره که از سال 1990 به طور جدی مطرح شده و در حال حاضر بیشتر تلاشهای محققان بر روی این روش متمرکز شده. به طور کلی میشه گفت که روشهای آماری و مبتنی بر مثال (Example-based) هر دو در یک دسته بزرگتر به نام روشهای مبتنی بر پیکره قرار میگیرند. به عبارت دیگه میشه گفت انواع روشهای ترجمه ماشینی به ترتیب ظهور و پیدایش عبارتند از:
1. مبتنی بر دیکشنری (که دیگه تقریبا منسوخ شدن)
2. مبتنی بر قانون (Rule-based) که گویا شما دارید در این زمینه فعالیت میکنید و من جسارت نمیکنم و توضیحی در این مورد نمیدم. فقط جهت تذکر عرض کنم که این روشها در حال حاضر برای جفت زبانهای پرکاربردی مانند انگلیسی-فرانسه، انگلیسی-عربی و ... به بلوغ نسبی بالایی رسیدن و در خصوص این زبانها دانشمندان رفتن سراغ دسته بعدی مترجمهای ماشینی. البته این نکته در مورد زبان فارسی صادق نیست و تا اونجایی که من میدونم به جز 3 مورد مترجم ماشینی (پروژه شیراز محصول دانشگاه New Mexico state حاصل فعالیتهای تیمی از محققان بالاخص خانم دکتر مگردومیان، پروژه PEnTrans محصول دانشگاه شهید بهشتی به سرپرستی خانم دکتر شمس فرد و مترجم دوران که در ادامه پروژه دکترای استاد عزیز هشام فیلی در دانشگاه شریف بوده )، کار دیگری در این زمینه صورت نگرفته و حالا حالاها جای کار داره.
3. روشهای مبتنی بر پیکره: این روشها به دو دسته کلی زیر تقسیم میشن:
الف) روشهای مبتنی بر مثال (Example based)
ب) روشهای آماری
برای جلوگیری از طولانی شدن بحث توضیح اضافه ای در این مورد نمیدم. فقط خدمتتون عرض کنم تا جایی که بنده میدونم، روشهای مبتنی بر مثال برای ترجمه یک جمله در پایگاه داده خودشون به دنبال جملات (یا قطعاتی از جملات) میگردن که بیشترین تشابه رو با جمله ورودی داشته باشه و اون رو به عنوان ترجمه ارائه میکنن. البته یه مقداری پردازش و چکش کاری هم روی این جملات انجام میشه. (به همین سادگی هم نیست). اما در کل بگم که این روش خیلی درگیر پارامترهای مختلف و یادگیری پارامترها و سایر داستانها نمیشه. در مجموع میشه گفت که تئوری بسیار ساده تری از روشهای آماری داره.
اما در روشهای آماری قضیه کلا متفاوته. این روشها با استفاده از پیکره ای که در اختیار دارن یک سری پارامترها رو استخراج میکنن (که مهمترینشون مدل زبان و مدل ترجمه هستند) و بعد با مشاهده یک جمله جدید در ورودی سعی میکنن با استفاده از اون پارامترها بهترین ترجمه رو برای جمله ورودی انتخاب کنن.

کار اصلی بنده و موضوع اصلی تحقیقاتی من ماشینهای ترجمه آماریه. خدا رو شکر از 1 سال پیش تا حالا کارهای خوبی در این زمینه انجام دادم و پیکره کوچیکی در این زمینه ساختم. این پیکره هنوز خیلی کوچیکه و من دنبال راههای دیگه ای هستم که بتونم حجمش رو افزایش بدم. یه سری روشها در این زمینه هست مثل استفاده از پیکره های قابل استفاده (Comparable Corpora) اما این روشها خیلی نویز دارن و چندان قابل استفاده نیستن. راههای دیگری هم هست که دارم امتحانشون میکنم.

اما در مورد این جمله که فرمودید:

چون کسی تا به حال این کار را نکرده و برای جمع آوری چنین پیکره ای یک کار تیمی با فرصت حداقل یک ساله لازم است بنا براین در مرحله اول می توان برای حل مشکل از روش Rule Based استفاده نمود
باید خدمتتون عرض کنم که روشهای مبتنی بر قاعده هم دردسرهای خاص خودشون رو دارند و تا جایی که من میدونم اگر بخوایم یک سیستم ترجمه مبتنی بر قاعده و یک سیستم ترجمه آماری که دارای دقت مشابهی باشند رو تولید کنیم، سیستم مبتنی بر قاعده بسیار هزینه بر تر و زمانبرتر خواهد بود. البته این رو هم بگم که نمیشه دو روش رو به این سادگی با هم مقایسه کرد. چرا که هر کدوم یک در یک جنبه ضعیف هستن و در جنبه دیگه قوی. بنابراین نمیشه به راحتی در مورد کارائیشون اظهار نظر کرد.
در مورد این جمله که فرمودید:

از جمله پیدا کردن قوانینی که نشان دهنده ارتباط بین اسامی ( صفت ، اسم ، صفت نسبی ، مضاف و مضاف الیه و .... ) در زبان فارسی باشد با توجه به این که Short vowel ها در فارسی نوشته نمی شوند
دکتر همایونپور از دانشگاه امیرکبیر خیلی خوب در این زمینه کار کردن و تا جایی که میدونم الگوریتمهایی که در این زمینه ارائه کردن، ترکیبات وصفی و اضافه ای رو به خوبی تشخیص میده.


در کل خوشحال میشم اگه بتونم در این زمینه بیشتر از کمکها و راهنماییهای شما بهره بگیرم. همچنین خوشحال میشم اگه بتونم در پروژه شما کمکی بکنم.


موفق باشید و در پناه حضرت حق

negin2000
سه شنبه 27 اردیبهشت 1390, 18:46 عصر
با سلام ،
چگونه می تونم به تحقیقات و الگوریتم شناسائی ترکیبات وصفی و اضافه ای که دکتر همایونپور انجام داده اند دسترسی داشته باشم ؟

با تشکر

aminfarajian
چهارشنبه 28 اردیبهشت 1390, 12:41 عصر
سلام
بهترین راه برای این منظور اینه که یه سر تشریف ببرین دانشگاه امیرکبیر، دانشکده مهندسی کامپیوتر و پایان نامه هایی که تحت راهنمایی ایشون بوده رو پیدا کرده و مطالعه کنید. یه راه دیگه هم اینه که اسم ایشون رو جستجوی کنید و مقاله هاشون رو دانلود کنید و بخونید که من این رو توصیه نمیکنم. دلیلش هم اینه که در مقاله فقط قصد اینه که کاری که انجام شده گزارش بشه و به میزان ناچیزی در مورد تئوری کار و نحوه انجام اون توضیح داده میشه. اما توی پایان نامه دانشجو بسیاری از مطالب و مخصوصا کار خودش رو باید به طور کامل شرح بده که این میتونه برای شما خیلی راهگشا باشه.
به تازگی شورای عالی اطلاع رسانی یک کتاب الکترونیک در مورد خطایاب املایی فارسی منتشر کرده که به نظر من کتاب بسیار خوبیه و میتونه به میزان زیادی در این زمینه کمکتون کنه. (البته شما بیشتر به بخشهایی از این کتاب نیاز دارید که در مورد انواع ترکیبات در زبان فارسی توضیح داده). اگر نتونستید فایلش رو پیدا کنید بگید که براتون ایمیلش کنم.
تا اونجایی که من میدونم دکتر همایونپور در زمینه تشخیص این ترکیبها در زبان فارسی خیلی خوب کار کردن و حتی گویا یک ماجول آماده هم در این زمینه دارن. اما اینکه آیا اون رو به کسی میدن یا خیر من اطلاعی ندارم. به نظر من بهترین راه اینه که اول خودتون برید دانشگاه و همونطور که گفتم پایان نامه هاشون رو بررسی کنید. بعد از طریق استاد راهنماتون با ایشون تماس بگیرید و تقاضای راهنمایی کنید. حتی در صورتی که تشخیص دادید ایشون میتونه در پروژتون خیلی کمکتون کنه میتونید به عنوان استاد راهنمای دوم یا استاد مشاور از ایشون کمک بگیرید. اینطوری خیلی راحت تر هم میتونید باشون ارتباط برقرار کنید و پروژتون رو پیش ببرید.

راستی تا اونجایی که یادم میاد یه کتاب فارسی هم در زمینه ترجمه ماشینی بود به اسم مقدمه ای بر ترجمه ماشینی. مولفش هم خانم دکتر طیبه موسوی میانگاه. یادم نیست که توی کتاب در مورد این ترکیبات حرفی زده بود یا نه. اما اگه بخواید میتونم براتون نگاه کنم.
یه کتاب دیگه هم هست در مورد پردازش خودکار زبان فارسی به اسم درآمدي بر پرولوگ و پردازش زبان فارس. من از این کتاب اصلا خوشم نیومد اما شما میتونید بگیرید و مطالعش کنید، شاید به دردتون بخوره.


باز هم اگه سوالی داشتین بنده در خدمتم.

y.alizadeh
سه شنبه 24 خرداد 1390, 18:26 عصر
سلام،
موضوع پایان نامه من هم مترجم آماری فارسی-انگلیسی هست. لطفا پیکره ای که جور کردید رو اگه میشه به منم معرفی کنید.
منم خیلی دنبالش گشتم ولی تا حالا چیزی پیدا نکردم!
ممنون میشم خبرم کنید.

toositest
شنبه 22 مرداد 1390, 19:17 عصر
با سلام
من هم مدتی است روی ساخت پیکره موازی به صورت ماشینی کار می کنم . اما برای کارم نیازمند پیکره هایی هستم که بدرستی تراز شده باشند
اگر چنین پیکره هایی رو دارید خوشحال می شوم انها را دراختیار من هم قرار بدید .
پیکره شیراز و میانگاه رو هم هر چه می گردم با این که گفته شده آزاد هستند پیدا نمی کنم اگر کسی راه بدست آوردنشون رو می دونه لطفا منو راهنمایی کنه.
یا حق

aminfarajian
شنبه 22 مرداد 1390, 19:38 عصر
سلام خدمت شما دوست عزیز
در مورد پیکره شیراز باید خدمتتون عرض کنم که من خودم هر چقدر گشتم نتونستم اون رو بدست بیارم. نکته جالب اینجاست که وقتی از افراد درگیر در پروژه پرسیدم که چه جور میشه به داده ها، منابع و کدهای پروژه دسترسی پیدا کرد فرمودند که دپارتمان کامپیوتر دانشگاه New Mexico State منحل شده و معلوم نیست که داده های این ماشین ترجمه کجاست. واقعا جالب و تحیر برانگیز بود. ولی حتی تلفنی هم که با دانشگاهشون تماس گرفتم هیچ نتیجه ای بدست نیاوردم.
پروژه میانگاه هم تا اونجایی که من متوجه شدم همونیه که روی سایت ELRA قرار داره.
http://catalog.elra.info/product_info.php?products_id=1111
این پیکره رو شما میتونی خریداری بکنی و در تحقیقاتت ازش استفاده کنی.
اما در مورد پیکره خودم بگم که ایشالله تا چند وقت دیگه اون رو به صورت آزاد روی اینترنت قرار خواهم داد که همه دوستان بتونن از اون استفاده کنن.

میشه شما بیشتر در مورد خودتون و دانشگاهتون توضیح بدین؟ کجا هستین؟ کدوم دانشگاه؟
موفق باشید.
خدانگهدار.

y.alizadeh
دوشنبه 25 مهر 1390, 11:38 صبح
سلام!
باعرض معذرت بابت تاخیر!
من دانشجوی دانشگاه شریف ،رشته هوش مصنوعی ، سال دوم هستم!
تاحالا پیکره آقای پیله ور را بدست آوردم ولی خیلی مفید نیست.
اگه کمکم کنید ممنون میشم.

chshbh
پنج شنبه 09 آبان 1392, 16:04 عصر
سلام دوست عزیز
من هم در این زمینه مشغول به کارم.
لطفا اگه مایل هستید تماس بگیرید.

chshbh@gmail.com

y.alizadeh
دوشنبه 13 آبان 1392, 10:05 صبح
بنده پروژه کارشناسی ارشدم رو سال گذشته تموم کردم.
برای ساخت مترجم یک پیکره تولید کردم که 160000 تا جمله داشت.
اگه حس میکنید پایان نامه یا پیکره من میتونه بهتون کمک کنه، باهام تماس بگیرید:
y.alizadeh@yahoo.com

با احترام
یوسف علیزاده

sam.gh
جمعه 01 آذر 1392, 14:58 عصر
سلامم
من دانشجوی ارشد هستم و میخوام تزم رو توی زمینه ابهام معنایی در ترجمه ماشینیآماری ور دارم ... اگه کسی میتونه کمک کنه به این ایمیل اطلاع بده...ممنون
samira.ghaibepoor@yahoo.com

قله بلند
سه شنبه 14 بهمن 1393, 22:46 عصر
سلام دوستان
این تاپیک رو دیدم که در مورد سیستم ترجمه است. انواع اش هم نام برده شد.
می خوام بدونم که اگر بخوام از شیوه مبتنی بر قواعد استفاده کنم، باید چه اقدامات اولیه ای انجام بدم. آیا تمام لغات دیکشنری و تمام اصطلاحات رو باید در بانک ذخیره کنم؟
متشکرم