من در زمینه مورد نظر شما ( سیستم ترجمه ماشینی از زبان فارسی به زبان مقصد ) کار می کنم ، همانطوریکه اطلاع دارید برای ایجاد ماشین ترجمه روشهای مختلفی از جمله Rule Based و Example Based وجود دارد که از نوشته های شما مشخص است که شما در حال انجام پروژه به روش Example Based می باشید . تا جائیکه من اطلاع دارم در این روش corpus شما حداقل باید در حدود یک میلیون جمله را شامل باشد که برای زبان فارسی این غیر ممکن است چون کسی تا به حال این کار را نکرده و برای جمع آوری چنین پیکره ای یک کار تیمی با فرصت حداقل یک ساله لازم است بنا براین در مرحله اول می توان برای حل مشکل از روش Rule Based استفاده نمود ( کاری که من در حال انجام آن هستم ) هر چند این روش هم مشکلات خاص خود را دارد از جمله پیدا کردن قوانینی که نشان دهنده ارتباط بین اسامی ( صفت ، اسم ، صفت نسبی ، مضاف و مضاف الیه و .... ) در زبان فارسی باشد با توجه به این که Short vowel ها در فارسی نوشته نمی شوند . اگر در این رابطه سئوال یا پاسخی داشتید آماده شنیدن هستم .