ورود

View Full Version : گفتگو: تبدیل متون فارسی به گفتار



BORHAN TEC
سه شنبه 07 خرداد 1392, 16:22 عصر
سلام خدمت همگی دوستان :قلب:

بنده قصد دارم که ماجولی بسازم که متون فارسی را به گفتار تبدیل کند. در این راستا مسائل متعددی در طراحی نرم افزار برای من مطرح است.

1- در ساده ترین حالت می توان صدای کلمات فارسی را ضبط کرده و در یک پایگاه داده ذخیره کرد. این روش بسیار نا کارآمد است و تولید چنین پایگاه داده ای بسیار زمانبر است و بنا به این دلایل نمیتوان از این روش در تولید این نرم افزار استفاده کرد.
__________________________________________________ _______
2- راه حل بعدی این است که صدای تمامی حروف فارسی را ضبط کرده و سپس متن را شکسته و تک تک حروف آن را بدست آورده و صدای معادل هر حرف را پخش کنیم. در حالت کلی این روش بسیار کارآمد است ولی پیاده سازی این روش نیاز به الگوریتم های خاصی دارد که مسئله اساسی من همین الگوریتم ها است. در همین راستا چند نکته حائز اهمیت است:

- در نوشته های فارسی معمولاً از سرکش ها(ٌ، ُ و ...) استفاده نمی شود.

- با توجه به امری بودن، تعجبی بودن و سوالی بودن جمله باید حالت صدا متفاوت باشد.

- از آنجا که این سیستم ممکن است که همیشه با کلمات جدیدی مواجه شود، مشخص است که نرم افزار باید آمادگی لازم را برای مواجهه با شرایط پیش بینی نشده داشته باشد و به عبارت دیگر باید از الگوریتم های هوش مصنوعی در این موضوع استفاده کرد.

- طبیعتاً مسائل مختلف دیگری هم وجود دارد که امیدوارم که با ادامه دادن این تاپیک و بحث و گفتگو به آن ها هم دست پیدا کنیم.

حال از دوستان خواهشمندم که نظرات خود را ارائه دهند تا با بحث و تبادل نظر به نتایج بهتری برای پیاده سازی جزئیات نرم افزار برسیم.

با تشکر فراوان...

arefba
سه شنبه 07 خرداد 1392, 16:26 عصر
شما لطف کن نرم افزار پارس خوان رو نصب کن
به محل نصب برو دیتا بیس و فایل های صوتی رو بگیر
تو میمونی و کد نویسی خوندنش
موفق باشی

BORHAN TEC
سه شنبه 07 خرداد 1392, 16:52 عصر
جناب arefba برنامه خیلی خوبی رو معرفی کردید و واقعاً ازتون به خاطر معرفی این نرم افزار متن باز تشکر می کنم. اگر به مقایسه کارایی سایت farsireader.com و این نرم افزار بپردازیم خواهیم دید که سایت farsireader.com هوشمندانه تر عمل می کند و صدایی که تولید می کند طبیعی تر به نظر می رسد. برای این که بهتر متوجه شوید به این مثال توجه کنید:
جمله "نتایج امتحان فردا مشخص می شود." را در نظر بگیرید.
- در زبان فارسی در خیلی از شرایط پیش می آید که کلمات به صورت ادامه دار در یک جمله خوانده می شوند. مثال: "امتحانِ فردا" (به علامت کسره دقت کنید). متاسفانه در نرم افزاری که شما معرفی کردید تمهیداتی برای تشخیص این موضوع پیش بینی نشده است و کلمات به صورت جدا جدا خوانده می شوند. البته غیر طبیعی بودن تلفظ در نرم افزار یاد شده بیشتر به خاطر فایل های صوتی است که نیاز به کمی Normalize دارد.

آیا دوستان برای حل این مشکل پیشنهادی دارند؟

Jarvis
دوشنبه 13 خرداد 1392, 22:13 عصر
سایت http://www.farsireader.com/ یکی از بهترین سیستم های تبدیل به نوشته به گفتار بود که تا حالا دیده بودم ...
ولی به نظر من چندین نقص داشت :
1- حروفی مثل "،" نقطه ... "سر سطر" و اینا رو هم همراه با جمله میخونه ... یعنی اگه دکمه ی Enter رو زده باشید ، قبل از جمله میگه "سر سطر" !!!
بهتر بود این مورد رو میگذاشتن به انتخاب خود کاربر...
2- صدای کسی که میخونه یه مقداری غیر معمولیه ... نمی دونم این سیستم چنین چیزی داره یا نه .. ولی اینجور سیستم ها خیلی خوبه که از کلمات پر کاربرد و حتی کلمات انگلیسی که به صورت فارسی نوشته میشن - مثل : دیتا شو - یا مثلا فایر فاکس ... - یه دیتابیس داشته باشن ... برای کلماتی هم که توی دیتابیس نیستن میشه با برنامه نویسی اول کلمه رو آنالیز کرد ... کلمه ی قبل و بعد رو هم آنالیز کرد و با توجه به اونا کلمه رو خوند..

یه راهی هم برای بهتر خوندن کلمات به ذهنم رسید ...
کلماتی که آخر جمله میان همیشه آخرین حرفشون ساکن هست ... الان همین سایت http://www.farsireader.com/ این نقص رو داشت!

اگه ما هم مثل عرب ها توی نوشته هامون حرکت ها رو رعایت می کردیم الان شاید کمتر دچار مشکل می شدیم ! :لبخند:

سعید صابری
یک شنبه 19 خرداد 1392, 13:31 عصر
به نظر من تبدیل متن بدون حرکات و علائم یه جورایی خیلی سخت باشه.(البته کار بدون نقص) چون خیلی از کلمات فارسی با هر کدام از حرکات معنی و شکل تلفظ خاصی دارند.
اگر از مترجم متن پدیده استفاده کرده باشید حتما دیده اید وقتی به کلمه میرسید که چند معنی داشت از کاربر می پرسید که کدام معنی مد نظر شماست روش جالبی نبود ولی خیلی کمک می کرد در بدست آمدن نتیجه بهتر. این هم یک روش دیگه!
یک مشکل عمده دیگر وجود داره وارد شدن کلمات زبان های دیگه مثل عربی! که بعضی کلماتشون مشابه کلمات ما هستند ولی تلفظ متفاوت دارند.
بحر حال فکر کنم یک زبان شناس بیشتر بتونه بهت کمک کنه تا برنامه نویس

بهروز عباسی
سه شنبه 22 مرداد 1392, 20:15 عصر
تبدیل حرف به صدا با استفاده از شبکه عصبی پرسپترون (http://www.mehrakizadeh.com/index.php?option=com_content&task=view&id=293&Itemid=1)

در اين مقاله ساختار يک سيستم تبديل حرف به صدا با معماری سه لايه و با استفاده از شبکه عصبی پرسپترون بررسی شده است.

جهت دریافت مقاله روی لینک زیر کلیک کنید:
دانلود (http://dl.mehrakizadeh.com/Electronic/Perceptron%20[www.mehrakizadeh.com].rar)