برای speech فارسی چه باید کرد؟

**ftmotlagh** · دوشنبه 15 بهمن 1386, 15:22 عصر

خوب، اول باید ببینیم کدام را سریعتره ...

**azarsoft** · چهارشنبه 17 بهمن 1386, 17:33 عصر

نوشته شده توسط bobrus

دوست عزیز از اینکه شما با این انرژی به دنبال برنامه نویسی هستی خوشحالم و از شما ممنونم من خودم وقت خیلی کمی برای کارهای خارج از شرکت دارم بنابراین برای رفع مشکلات در کنار شما خواهم بود امیدوارم به نتیجه برسیم
راه حلی که آقای MBt925 میگه مستلزم اینکه ما دستور زبان فارسی رو به برنامه تبدیل کنیم
در این صورت باید 32 حرف فارسی را در چهار حالت ( فتحه - کسره - ضمه و ساکن ) تلفظ کنیم و چون در فارسی از این علائم استفاده نمی شه تشخیصش با ماست و باید بشینیم تمام کلمات رو تجزیه تحلیل کنیم که این حرف با چه حرفی میاد و با چه حرکتی خوانده میشه و در جاهایی هم باید از جمله بفهمیم که این کلمه چیه :
مثلاً: کلمه (می) هم می تونه ابتدایه یه کلمه باشه(می توان) هم می تونه به تنهایی به کار بره(به معنی شراب). حروف (وا) که گاهی به صورت الف تنها و گاهی کامل خوانده می شن
بنابراین آقای Mbt925 سخترین روش برای اینکار روشی هست که شما گفتین
ولی مهم اینکه آیا این سختی کشیدن ارزش داره روش کار کنیم؟ و آیا حتماً میشه به نتیجه واقعی رسید یا نه؟(منظورم اینه که این استثنا ها اونقد هستند که بشه محدودش کرد و تو یه برنامه نوشت)

من الان مدت چند هفته است روی این پروژه کار می کنم به جاهایی هم رسیدم ولی در جواب این دوستمون و روشی که مطرح کردن باید بگم
اولا هر حرف رو در 7 حالت باید ضبط کنیم
برای مثال :
م - مَ - مِ - مُ - ما - مو - می
این بهترین راه در این روشه که در تلفظ کم نمیاد

دوم : ببینید من این روش رو در حالت های مختلف تست کردم
- در جداسازی و تشخیص حرف ها با صداهای مختلف مشکلی نیست
- در پیداسازی قواعد فارسی و استسناها هم مشکلی نیست
ولی مشکل اساسی در هنگام پخش صدا به وجود میاد یعنی صدا به هیچ شکل بصورت طبیعی اجرا نمیشه و دقیقا مثل نرم افزار های تلفظ انگلیسی پخش میشه که در این روش بهترهه به قول دوستمون که پیشنهاد داده کلمات رو به فینگلیشی تبدیل و بعد تلفظ کنیم استفاده کنیم .
ولی از طرفی هم منطقی ترین روش همین روشی که باید مشکلی که گفتم روش حل بشه .

به هر حال من دنبال روش هایی برای حل این مشکل هستم از دوستان کسی اگه راه حلی داره بگه یک تستی بزنیم و نتیجه رو بگیم .
به هر حال تا اینجا رو داشته باشید تا بعد

**rostamkhani** · چهارشنبه 17 بهمن 1386, 21:36 عصر

اگه میخواین یه چیزه درست حسابی بنویسین باید در زمینه DSP کار کنین
Digital Signal Processing

بچه ها این ببینید جالبه
https://barnamenevis.org/showthread.php?t=5849

کتابی معروف درباره Digital Signal Processing
http://rapidshare.de/files/7789875/M....eBook-BBL.rar

دانلود کتاب در موضوع مورد نظر
http://search.gigapedia.org/items?q=...l%20processing

یک مثال از DSP در vb
از سایت www.vbfrance.com
http://www.vbfrance.com/codes/CREER-ECHO_34857.aspx

**ftmotlagh** · پنج شنبه 18 بهمن 1386, 12:26 عصر

من الان مدت چند هفته است روی این پروژه کار می کنم به جاهایی هم رسیدم ولی در جواب این دوستمون و روشی که مطرح کردن باید بگم
اولا هر حرف رو در 7 حالت باید ضبط کنیم
برای مثال :
م - مَ - مِ - مُ - ما - مو - می
این بهترین راه در این روشه که در تلفظ کم نمیاد

دوم : ببینید من این روش رو در حالت های مختلف تست کردم
- در جداسازی و تشخیص حرف ها با صداهای مختلف مشکلی نیست
- در پیداسازی قواعد فارسی و استسناها هم مشکلی نیست
ولی مشکل اساسی در هنگام پخش صدا به وجود میاد یعنی صدا به هیچ شکل بصورت طبیعی اجرا نمیشه و دقیقا مثل نرم افزار های تلفظ انگلیسی پخش میشه که در این روش بهترهه به قول دوستمون که پیشنهاد داده کلمات رو به فینگلیشی تبدیل و بعد تلفظ کنیم استفاده کنیم .
ولی از طرفی هم منطقی ترین روش همین روشی که باید مشکلی که گفتم روش حل بشه .

به هر حال من دنبال روش هایی برای حل این مشکل هستم از دوستان کسی اگه راه حلی داره بگه یک تستی بزنیم و نتیجه رو بگیم .
به هر حال تا اینجا رو داشته باشید تا بعد

شما چه جوری می خواین تشخیص بدید که یک حرف صدای مَ یا مُ ؟؟؟؟؟؟

**azarsoft** · جمعه 19 بهمن 1386, 13:28 عصر

نوشته شده توسط ftmotlagh

شما چه جوری می خواین تشخیص بدید که یک حرف صدای مَ یا مُ ؟؟؟؟؟؟

خیلی ساده است
اگر کمی به عقب یعنی سالهای راهنمایی بر گردی و مروری بر فارسی و عربی اون زمان بکنی می فهمی که هر حرفی قبل و بعد خاصی دارد مانند:

بعد از هر حرفی اگر ( ا) بیاد اون حرف در صیغه چهارم خوانده می شود مثال :

مادر = م +ادر در تلفظ حرف ( ا ) کسر و ( م )در صیغه چهارم یعنی ( ما ) خوانده می شود .
مار - ماسه - ماشین - ماه - مازندران - ماکو - مانده - ماهی
یا هر گاه بعد از ( م ) حرف ( ب ) بیاد ( م ) بصورت ( مُ ) خوانده می شود
مثال :
مبارک - مبالغه - مبارزه - مباهات - مباشر - مبتدا - مبتذل - مبتکر - مبتلا
استسنا : مبحث - مبدا ، که در استسناها ( م ) بصورت ( مَ ) خوانده می شود که این هم به خاطر حرف سوم بی صدا است .
در بیشتر استسناها حرف مورد نظر ( َ ) می گیرد (فتحه )
اگر این قواعد رو به درستی بتونیم پیدا کنیم در تشخیص کلمات مشکلی پیش نمیاد .

البته استسناهایی هم وجود دارد که باید لیستی از استسناها رو به وجود بیاریم.

اگه بخواهی ساده تر بگم از قواعد دستور زبان فارسی استفاده می کنیم .

**ftmotlagh** · یک شنبه 21 بهمن 1386, 22:09 عصر

اینجوری هم یه دیتابیس برای صداها می خوایم و یک دیتابیس برای استثناها و یه عالمه برنامه نویسی و الگوریتم اگه ما یک دیتابیس 10000 کلمه ای بسازیم که بهتره که اونم مشکلات خودشو داره...

**azarsoft** · یک شنبه 21 بهمن 1386, 23:14 عصر

نوشته شده توسط ftmotlagh

اینجوری هم یه دیتابیس برای صداها می خوایم و یک دیتابیس برای استثناها و یه عالمه برنامه نویسی و الگوریتم اگه ما یک دیتابیس 10000 کلمه ای بسازیم که بهتره که اونم مشکلات خودشو داره...

دوست عزیز برنامه نویسی یعنی همین دیگه
در روشی که من گفتم شما نهایتا 300 حرف رو ضبط می کنید و چند خط بیشتر برنامه نویسی می کنید ولی در عوض سیستمی به وجود میارید که میشه به راحتی صدای شخص رو تو اون شبیه سازی کرد و صداهای دیگری رو نیز جایگزین نمود ولی در روشی که شما بیان می کنید اولا برای اینکه دیتابیس کاملی داشته باشید حداقل باید صد هزار کلمه رو ضبط کنید دوما هر بار که خواستید صدای برنامه رو تغییر بدهید باید از نوع صد هزار کلمه را ضبط کنید ( برای مثال پخش صدای مرد و زن و هر شخص دیگری که می خواهد تن صدایش توسط کامپیوتر شبیه سازی شود ) سوما برنامه شما فقط بصورت کتابی می خواند و نوشته ها و کلمات جدید رو نمی تونه بخوند در روشی که من می گم حتی کلمات و جملات بی معنی نیز قابلیت خواندن دارند

**ABERTINO** · دوشنبه 22 بهمن 1386, 08:40 صبح

آقای Azarsof باشما کاملاً موافقم فقط اگه یه لطفی بکنید و راهنمایی کنید که از چه منابعی استفاده کردید ممنون میشم چون من هم به شدت دنبال یه همچین مطلبی هستم

**ftmotlagh** · دوشنبه 22 بهمن 1386, 12:34 عصر

بله این راه منطقی تره ...
حق با شماست.

**azarsoft** · دوشنبه 22 بهمن 1386, 14:45 عصر

نوشته شده توسط ABERTINO

آقای Azarsof باشما کاملاً موافقم فقط اگه یه لطفی بکنید و راهنمایی کنید که از چه منابعی استفاده کردید ممنون میشم چون من هم به شدت دنبال یه همچین مطلبی هستم

ببینید من چند سال پیش یعنی دوره هنرستان این طرح رو به عنوان پروژه پایانی انتخاب کرده بودم البته اون زمان روی داس و محیطهای برنامه نویسی داس می خواستم چنین کاری رو بکنم و هدفم ایجاد صدا با فرکانسهای تولیدی توسط کامپیوتر بود ( البته اون موقع به علت ضعف برنامه نویسی و نداشتن حامی خوبی دست از این کار برداشتم ) و همون زمان طی بررسی هایی که کردم و مطالعه هایی که نمودم به یک کتاب به اسم " چگونه فارسی بخوانیم و تلفظ کنیم : حالا دقیق یادم نیست اسمش شاید کمی فرق داشت ولی به هر حال مطالبی توی اون کتاب مبنی برا حروف صدادار و بی صدا و حرفهای صدا دار خواندم البته الان اون کتاب رو ندارم ولی بخش مربوط به تلفظ و حرکات رو یاداشت برداری کردم ( بخشی از ههمین موارد رو طی سالهای تحصیل از همان سال اول توی کتاب فارسی و بعد ها در دستور زبان فارسی و حتی در عربی هم خواندیم ( تلفظ عربی و فارسی شباهات بسیار زیادی دارد )

حالا اگر شما بتونید این قواعد رو سر هم بیارید و بصورت یک تابع دربیارید خیلی ساده می تویند این برنامه رو بنویسید .
البته من هنوز سر این موضوع که صدای تولید شده و پخش شده زیاد طبیعی نمیشه اسرار دارم و دنبال راه حلی برای این موضوع هستم ، تقریبا همه قسمتهای تشخیص و جدا سازی کلمات رو طراحی و پیداه سازی کردم و فقط مشکلم سر همین تلفظ غیر طبیعی است . و چون سرم در شرکت شلوغه نمی رسم بقیه کارهاش رو بکنم و زیاد روش کار کنم

حالا شما دوست عزیز یا هر یک از سایر دوستانمان قصد دارد روی این پروژه کار کند حاضرم باهاش همکاری کنم و می تونم هر امکانی که بخواهید تو محل شرکت در اختیارتون بذارم .

جهت ارتباط با من می تونید از میل زیر استفاده کنید :
Azarsoft@gmail.com

**rostamkhani** · چهارشنبه 24 بهمن 1386, 23:26 عصر

بنده هم یه همچین کار رو انجم داردم نه در حد کامل برای تمامی حروف در حد تست
دقیقا اولین مشکل اون غیر طبیعی بودن اون که خیلی مهم و اعمال سوالی بودن یا تعجب آمیز بودن جمله و غیره که در speech های microsoft موجود است
بعد با برسی بیشتر به این نتیجه رسیدم باید برای نوشتن یه چیز درست حسابی
در زمینه DSP به طور حرفه ای کار کرد .
موفق باشید

**azarsoft** · پنج شنبه 25 بهمن 1386, 13:48 عصر

نوشته شده توسط rostamkhani

بنده هم یه همچین کار رو انجم داردم نه در حد کامل برای تمامی حروف در حد تست
دقیقا اولین مشکل اون غیر طبیعی بودن اون که خیلی مهم و اعمال سوالی بودن یا تعجب آمیز بودن جمله و غیره که در speech های microsoft موجود است
بعد با برسی بیشتر به این نتیجه رسیدم باید برای نوشتن یه چیز درست حسابی
در زمینه DSP به طور حرفه ای کار کرد .
موفق باشید

دوست عزیز مبحث پردازش دیجیتالی صدا هم کمک زیادی نمی کنه چون هنوز این مشکل غیر طبیعی بودن صدا روی زبان انگلیسی هم هست و نتونستن حلش کن .
با کامپیوتر و تولید کننده های دیجیتالی صدا نمی توان به راحتی صدایی مشابه صدایی که از هنجره انسان درمیاد تولید کرد.

البته هیچ کاری نشد نداره باید بیشتر سعی کنیم و بیشتر فورمول نویسی کنیم .
بازم می گم من حاضرم روی این پروژه با همه دوستانی که تمایل دارند همکاری کنم .

**AlirezaSaberi** · جمعه 26 بهمن 1386, 10:59 صبح

سلام دوستان
من این تاپیک رو تازه دیدم و همه پست های اونو خوندم
1)اول گله کنم که خیلی از دوستان اصلا موضوع رو متوجه نشدن باز جای شکرش باقیه که خیلی از پست ها توسط مدیران حذف شد!
2)یک بحثی اول تاپیک بود که این کار شده و به فلان جا یک میلیارد فروخته شده. من فروخته شدنش رو باور میکنم ولی تولید شدنش رو باور نمیکنم
3) برای هر پروژه ای باید اول از همه به مساله اشراف کامل داشت بنابر این حتما با متخصصان زبان فارسی مشورت کرد همونطور که دوست عزیزمون azarsoft اشاره کرد
4) از لحاظ فنی الگوریتم azarsoft بسیار منطقی تر و اجرایی تر از بقیه راه حل ها میاد و بعد از اون بانک و تبدیل کلمات به filnglish که البته نظر من تبدیل اونها به فونتیک کلماته
5) غیر طبیعی بودن صداجدای از فرکانس صدا به شکل موج صدا و هارمونی های زمینه اون بستگی داره .ثل اینکه همه خوانندگان موسیقی نت سی رو درست تلفظ میکنن ولی هیچکدوم مثل هم تلفظ نمیکنن. نکته دوم احساسیه که پشت تلفظ نهفته است. خلاصه بگم حرف میم توی کلمه مار و مامان مثل هم تلفظ نمیشه و حرف ج توی جیغ و جیگر هم مثل هم تلفظ نمیشه و احساس خاصی رو القا میکنن
تازه به قولی ما آذری ها چند نوع کاف داریم ...

موفق باشید
کار نشد نداره مخصوصا توی بحث تکنولوژی

نام تاپیک: برای speech فارسی چه باید کرد؟

ابزار های تاپیک

نمایش

تاپیک های مشابه

ارسال متن به speech

Speech

Speech فارسی

Speech

قوانین ایجاد تاپیک در تالار