خوب، اول باید ببینیم کدام را سریعتره ...
من الان مدت چند هفته است روی این پروژه کار می کنم به جاهایی هم رسیدم ولی در جواب این دوستمون و روشی که مطرح کردن باید بگم
اولا هر حرف رو در 7 حالت باید ضبط کنیم
برای مثال :
م - مَ - مِ - مُ - ما - مو - می
این بهترین راه در این روشه که در تلفظ کم نمیاد
دوم : ببینید من این روش رو در حالت های مختلف تست کردم
- در جداسازی و تشخیص حرف ها با صداهای مختلف مشکلی نیست
- در پیداسازی قواعد فارسی و استسناها هم مشکلی نیست
ولی مشکل اساسی در هنگام پخش صدا به وجود میاد یعنی صدا به هیچ شکل بصورت طبیعی اجرا نمیشه و دقیقا مثل نرم افزار های تلفظ انگلیسی پخش میشه که در این روش بهترهه به قول دوستمون که پیشنهاد داده کلمات رو به فینگلیشی تبدیل و بعد تلفظ کنیم استفاده کنیم .
ولی از طرفی هم منطقی ترین روش همین روشی که باید مشکلی که گفتم روش حل بشه .
به هر حال من دنبال روش هایی برای حل این مشکل هستم از دوستان کسی اگه راه حلی داره بگه یک تستی بزنیم و نتیجه رو بگیم .
به هر حال تا اینجا رو داشته باشید تا بعد
اگه میخواین یه چیزه درست حسابی بنویسین باید در زمینه DSP کار کنین
Digital Signal Processing
بچه ها این ببینید جالبه
https://barnamenevis.org/showthread.php?t=5849
کتابی معروف درباره Digital Signal Processing
http://rapidshare.de/files/7789875/M....eBook-BBL.rar
دانلود کتاب در موضوع مورد نظر
http://search.gigapedia.org/items?q=...l%20processing
یک مثال از DSP در vb
از سایت www.vbfrance.com
http://www.vbfrance.com/codes/CREER-ECHO_34857.aspx
شما چه جوری می خواین تشخیص بدید که یک حرف صدای مَ یا مُ ؟؟؟؟؟؟من الان مدت چند هفته است روی این پروژه کار می کنم به جاهایی هم رسیدم ولی در جواب این دوستمون و روشی که مطرح کردن باید بگم
اولا هر حرف رو در 7 حالت باید ضبط کنیم
برای مثال :
م - مَ - مِ - مُ - ما - مو - می
این بهترین راه در این روشه که در تلفظ کم نمیاد
دوم : ببینید من این روش رو در حالت های مختلف تست کردم
- در جداسازی و تشخیص حرف ها با صداهای مختلف مشکلی نیست
- در پیداسازی قواعد فارسی و استسناها هم مشکلی نیست
ولی مشکل اساسی در هنگام پخش صدا به وجود میاد یعنی صدا به هیچ شکل بصورت طبیعی اجرا نمیشه و دقیقا مثل نرم افزار های تلفظ انگلیسی پخش میشه که در این روش بهترهه به قول دوستمون که پیشنهاد داده کلمات رو به فینگلیشی تبدیل و بعد تلفظ کنیم استفاده کنیم .
ولی از طرفی هم منطقی ترین روش همین روشی که باید مشکلی که گفتم روش حل بشه .
به هر حال من دنبال روش هایی برای حل این مشکل هستم از دوستان کسی اگه راه حلی داره بگه یک تستی بزنیم و نتیجه رو بگیم .
به هر حال تا اینجا رو داشته باشید تا بعد
خیلی ساده است
اگر کمی به عقب یعنی سالهای راهنمایی بر گردی و مروری بر فارسی و عربی اون زمان بکنی می فهمی که هر حرفی قبل و بعد خاصی دارد مانند:
بعد از هر حرفی اگر ( ا) بیاد اون حرف در صیغه چهارم خوانده می شود مثال :
مادر = م +ادر در تلفظ حرف ( ا ) کسر و ( م )در صیغه چهارم یعنی ( ما ) خوانده می شود .
مار - ماسه - ماشین - ماه - مازندران - ماکو - مانده - ماهی
یا هر گاه بعد از ( م ) حرف ( ب ) بیاد ( م ) بصورت ( مُ ) خوانده می شود
مثال :
مبارک - مبالغه - مبارزه - مباهات - مباشر - مبتدا - مبتذل - مبتکر - مبتلا
استسنا : مبحث - مبدا ، که در استسناها ( م ) بصورت ( مَ ) خوانده می شود که این هم به خاطر حرف سوم بی صدا است .
در بیشتر استسناها حرف مورد نظر ( َ ) می گیرد (فتحه )
اگر این قواعد رو به درستی بتونیم پیدا کنیم در تشخیص کلمات مشکلی پیش نمیاد .
البته استسناهایی هم وجود دارد که باید لیستی از استسناها رو به وجود بیاریم.
اگه بخواهی ساده تر بگم از قواعد دستور زبان فارسی استفاده می کنیم .
اینجوری هم یه دیتابیس برای صداها می خوایم و یک دیتابیس برای استثناها و یه عالمه برنامه نویسی و الگوریتم اگه ما یک دیتابیس 10000 کلمه ای بسازیم که بهتره که اونم مشکلات خودشو داره...
دوست عزیز برنامه نویسی یعنی همین دیگه
در روشی که من گفتم شما نهایتا 300 حرف رو ضبط می کنید و چند خط بیشتر برنامه نویسی می کنید ولی در عوض سیستمی به وجود میارید که میشه به راحتی صدای شخص رو تو اون شبیه سازی کرد و صداهای دیگری رو نیز جایگزین نمود ولی در روشی که شما بیان می کنید اولا برای اینکه دیتابیس کاملی داشته باشید حداقل باید صد هزار کلمه رو ضبط کنید دوما هر بار که خواستید صدای برنامه رو تغییر بدهید باید از نوع صد هزار کلمه را ضبط کنید ( برای مثال پخش صدای مرد و زن و هر شخص دیگری که می خواهد تن صدایش توسط کامپیوتر شبیه سازی شود ) سوما برنامه شما فقط بصورت کتابی می خواند و نوشته ها و کلمات جدید رو نمی تونه بخوند در روشی که من می گم حتی کلمات و جملات بی معنی نیز قابلیت خواندن دارند
آقای Azarsof باشما کاملاً موافقم فقط اگه یه لطفی بکنید و راهنمایی کنید که از چه منابعی استفاده کردید ممنون میشم چون من هم به شدت دنبال یه همچین مطلبی هستم
ببینید من چند سال پیش یعنی دوره هنرستان این طرح رو به عنوان پروژه پایانی انتخاب کرده بودم البته اون زمان روی داس و محیطهای برنامه نویسی داس می خواستم چنین کاری رو بکنم و هدفم ایجاد صدا با فرکانسهای تولیدی توسط کامپیوتر بود ( البته اون موقع به علت ضعف برنامه نویسی و نداشتن حامی خوبی دست از این کار برداشتم ) و همون زمان طی بررسی هایی که کردم و مطالعه هایی که نمودم به یک کتاب به اسم " چگونه فارسی بخوانیم و تلفظ کنیم : حالا دقیق یادم نیست اسمش شاید کمی فرق داشت ولی به هر حال مطالبی توی اون کتاب مبنی برا حروف صدادار و بی صدا و حرفهای صدا دار خواندم البته الان اون کتاب رو ندارم ولی بخش مربوط به تلفظ و حرکات رو یاداشت برداری کردم ( بخشی از ههمین موارد رو طی سالهای تحصیل از همان سال اول توی کتاب فارسی و بعد ها در دستور زبان فارسی و حتی در عربی هم خواندیم ( تلفظ عربی و فارسی شباهات بسیار زیادی دارد )
حالا اگر شما بتونید این قواعد رو سر هم بیارید و بصورت یک تابع دربیارید خیلی ساده می تویند این برنامه رو بنویسید .
البته من هنوز سر این موضوع که صدای تولید شده و پخش شده زیاد طبیعی نمیشه اسرار دارم و دنبال راه حلی برای این موضوع هستم ، تقریبا همه قسمتهای تشخیص و جدا سازی کلمات رو طراحی و پیداه سازی کردم و فقط مشکلم سر همین تلفظ غیر طبیعی است . و چون سرم در شرکت شلوغه نمی رسم بقیه کارهاش رو بکنم و زیاد روش کار کنم
حالا شما دوست عزیز یا هر یک از سایر دوستانمان قصد دارد روی این پروژه کار کند حاضرم باهاش همکاری کنم و می تونم هر امکانی که بخواهید تو محل شرکت در اختیارتون بذارم .
جهت ارتباط با من می تونید از میل زیر استفاده کنید :
Azarsoft@gmail.com
بنده هم یه همچین کار رو انجم داردم نه در حد کامل برای تمامی حروف در حد تست
دقیقا اولین مشکل اون غیر طبیعی بودن اون که خیلی مهم و اعمال سوالی بودن یا تعجب آمیز بودن جمله و غیره که در speech های microsoft موجود است
بعد با برسی بیشتر به این نتیجه رسیدم باید برای نوشتن یه چیز درست حسابی
در زمینه DSP به طور حرفه ای کار کرد .
موفق باشید
دوست عزیز مبحث پردازش دیجیتالی صدا هم کمک زیادی نمی کنه چون هنوز این مشکل غیر طبیعی بودن صدا روی زبان انگلیسی هم هست و نتونستن حلش کن .
با کامپیوتر و تولید کننده های دیجیتالی صدا نمی توان به راحتی صدایی مشابه صدایی که از هنجره انسان درمیاد تولید کرد.
البته هیچ کاری نشد نداره باید بیشتر سعی کنیم و بیشتر فورمول نویسی کنیم .
بازم می گم من حاضرم روی این پروژه با همه دوستانی که تمایل دارند همکاری کنم .
سلام دوستان
من این تاپیک رو تازه دیدم و همه پست های اونو خوندم
1)اول گله کنم که خیلی از دوستان اصلا موضوع رو متوجه نشدن باز جای شکرش باقیه که خیلی از پست ها توسط مدیران حذف شد!
2)یک بحثی اول تاپیک بود که این کار شده و به فلان جا یک میلیارد فروخته شده. من فروخته شدنش رو باور میکنم ولی تولید شدنش رو باور نمیکنم
3) برای هر پروژه ای باید اول از همه به مساله اشراف کامل داشت بنابر این حتما با متخصصان زبان فارسی مشورت کرد همونطور که دوست عزیزمون azarsoft اشاره کرد
4) از لحاظ فنی الگوریتم azarsoft بسیار منطقی تر و اجرایی تر از بقیه راه حل ها میاد و بعد از اون بانک و تبدیل کلمات به filnglish که البته نظر من تبدیل اونها به فونتیک کلماته
5) غیر طبیعی بودن صداجدای از فرکانس صدا به شکل موج صدا و هارمونی های زمینه اون بستگی داره .ثل اینکه همه خوانندگان موسیقی نت سی رو درست تلفظ میکنن ولی هیچکدوم مثل هم تلفظ نمیکنن. نکته دوم احساسیه که پشت تلفظ نهفته است. خلاصه بگم حرف میم توی کلمه مار و مامان مثل هم تلفظ نمیشه و حرف ج توی جیغ و جیگر هم مثل هم تلفظ نمیشه و احساس خاصی رو القا میکنن
تازه به قولی ما آذری ها چند نوع کاف داریم ...
موفق باشید
کار نشد نداره مخصوصا توی بحث تکنولوژی