PDA

View Full Version : برای speech فارسی چه باید کرد؟



bobrus
شنبه 10 آذر 1386, 13:42 عصر
سلام به دوستان
می خواستم ببینم کسی در مورد speech فارسی کاری کرده آیا چینین چیزی هست یا نه ؟
یا کسی راه حلی داره؟:متفکر:

ali_habibi1384
دوشنبه 12 آذر 1386, 19:42 عصر
آره هستش یکی از استادام داره که به مجلس فروخته قیمتش هم بالای یک میلیارد بود!
کار آسونی نیست برای راهنمایی بگم که یه پایگاه صدا لازم داری و کلی کد نویسی.

M8SPY_OK
دوشنبه 12 آذر 1386, 20:57 عصر
آره هستش یکی از استادام داره که به مجلس فروخته قیمتش هم بالای یک میلیارد بود!
کار آسونی نیست برای راهنمایی بگم که یه پایگاه صدا لازم داری و کلی کد نویسی.


علی تونی ؟

bobrus
سه شنبه 13 آذر 1386, 09:33 صبح
علی جان میدونم که باید یه پایگاه داشته باشم ولی تو فارسی برعکس انگلیسی کلی کلمه های بزرگ و کوچک باهم کلی فرق می کنن تو انگلیسی فاصله یعنی یه کلمه جدید ولی تو فارسی اینجوری نسیت و خیلی مشکلات دیگه .
می خواستم بدونم کسی هست که یه روش برای شناسایی کلمات داشته باشه؟

moslem-visual
چهارشنبه 14 آذر 1386, 22:59 عصر
اگه همه جا میگن کار نشد نداره اینجا من یکی که میگم نمیشه! حداقل حالا حالاها نمیشه مگر اینکه یه گروه و سرمایه و تحقیقات درت درمون کنار هم جمع بشه اونوقت تازه شاید بشه نصفه و نیمه کاری کرد، الگوریتمش هم اینجوری نیست که بشه گفت!

perfeshnal
چهارشنبه 14 آذر 1386, 23:14 عصر
سلام

نه دوست من کار نشد نداره ولی هر کاری زحمت خودش رو داره من تازه گیها تو یکی از خبرها خوندم که یک شرکت این کار رو کرده و شما می تونید به صورت فارسی بخوانید و کامپیوتر تایپ کنه البته فکر کنم هنوز کارشون به پایان نرسیده باشه

__siavash__
چهارشنبه 14 آذر 1386, 23:30 عصر
سلام

نه دوست من کار نشد نداره ولی هر کاری زحمت خودش رو داره من تازه گیها تو یکی از خبرها خوندم که یک شرکت این کار رو کرده و شما می تونید به صورت فارسی بخوانید و کامپیوتر تایپ کنه البته فکر کنم هنوز کارشون به پایان نرسیده باشه
سلام
اون کارو توی تلویزیون نشون داد!
طرف فارسی صحبت میکرد کامپیوتر تایپ میکرد! (اونی رو که نشون دادند بدون غلط تایپ کرد)

bobrus
پنج شنبه 15 آذر 1386, 15:38 عصر
فکرمی کنم همه تو این کار جا زدن هیچ کس جرئت طرفش رفتنو نداره نه ؟!!!؟
البته نمی گم که ما بخونیم کامپیوتر تایپ کنه می گم ما تایپ کنیم کامپیوتر بخونه مثل همون text speech خود ویندوز ولی همین طور که ما صحبت می کینم نه اینطوری که الان ویندوز می خونه( یعنی رون و راحت).

مبین رنجبر
پنج شنبه 15 آذر 1386, 17:53 عصر
100 % میشه ... من اگر 3 ماه بیکار بودم مینوشتمش ..... فقط نیاز به یه دیتابیس قوی داره که تمام حروف ، کلمات و حالت ها رو توش داشته باشه .... و یه چیزتم خیلی مهمه اونم صدای خوبه که تلفظ کنه ...

Ali_ilA
پنج شنبه 15 آذر 1386, 18:22 عصر
من تو نمایشگاهی که تو دانشگاهمون بود یکیشو دیدم . اسمش نویسا بود . اونجوری که طرف می گفت دقتش بالای 95 بود . جلوی ما هم که حرف می زد بدون غلط تایپ میشد . قیمتش هم 2.5 میلیون تومان بود .

persia boy
جمعه 16 آذر 1386, 15:09 عصر
فکر نمی کنم به این مشکلی باشه شرکت های المانی وقتی همچنین برنامه های می نویسند فارسی هم در ان اضافه می کنند مثل مترجم و گفتار و ... فکر کنم کامپوننتی هم ساخته باشند چون من انگلیسی به انگلیسی را کامپوننتش را دیدم

bobrus
یک شنبه 18 آذر 1386, 18:27 عصر
مهمترین کار تو این برنامه اینه که بتونی کلمه رو تشخیص بدی یعنی یه کلمه مثل (می خوانم) دو بخش داره که با فاصله همراهه پس اینکه تو یه جمله واسه پیدا کردن کلمه دنبال فاصله بگردیم راه حل خوبی نیست چه کار کنیم بهترین راه حل که سریع هم باشه چیه؟

مبین رنجبر
یک شنبه 18 آذر 1386, 18:54 عصر
باید جمله هارو با نقطه از هم تفکیک کرد و وقتی برنامه به نقطه ای رسید صدای تلفظ قطع بشه و دوباره جمله بعد خونده بشه .......در ضمن در جمله هایی که اسپیس داره من پیشنهاد میدم که اول اسپیس های جمله رو حذف کنه و بعد بخونه ... نظر دوستان دیگه چیه ؟

sokote_bi_payan
سه شنبه 20 آذر 1386, 00:27 صبح
به نام خدا

با سلام فکر می کنم اگه یک بانک اطلاعاتی قوی داشته باشی و بعد بیای هر کلمه رو با استفاده از تابع split از همدیگه جدا کنی و تک تک از اون بانک اطلاعاتی ات بخونی اش. کار زیاد سختی نیست اما فکر زمان بره

bobrus
سه شنبه 20 آذر 1386, 08:34 صبح
با سلام
آقای lsass.crc32 اگه همه اسپیس ها رو حذف کنیم دیگه کلمه معنایی نداره که بشه اونو توی بانک جستجوش کرد یعنی همه چیز به هم می خوره شاید دیگه نشه فهمید که جمله نوشته شده چی بوده ولی در مورد نقطه موافقم باید جمله ها با نقطه از هم جدا بشن.
آقای sokote-bi-payan اگه قرار باشه یه کلمه رو با split کردن به صورت حرف به حرف بخونیم اصلاً کلمه خوانا نمیشه یعنی طرف نمی فهمه که چه کلمه ای خونده شده و سرعت خوندن هم پایین میاد

bobrus
شنبه 24 آذر 1386, 15:37 عصر
راه حل
نمی دونم چرا به این تاپیک کمتر توجه میشه ولی به هر حال من یه راه حل به ذهنم رسیده
فکر کنم بهتره یه لیست از شرایط استثنا درست کنیم (یعنی مثلاً اون کلمه هایی که دو جزءی هستند مثل می خوانم )بعد بررسی کنیم ببینیم شرایط مشابه کدوما هستند اونجوری بهتر میشه روش تمرکز کرد و الگوریتم در آورد ؟ کیا وقت اینکارو دارن و می تونن اینکارو بکنن؟؟؟؟

mosab_vb
دوشنبه 26 آذر 1386, 15:24 عصر
سلام.شاید اینی که می گم درست نباشه.اما فکر نکنم که برای این کار همه کلمه ها رو بخونی و ذخیره کنی بعد با متن تطبیق بدی و کامپیوتر برات بخونه.نه اصلا این طوری نیست.برای این کار به یک فایل ocr نیاز دارید که خودتون باید فارسیش رو طراحی کنید.فقط باید تون صداتون رو مشخص کنید تا برنامه براتون بخونه.این فایل کار تبدیل متن به صدا رو انجام میده.اگه بخواید همه لغت ها رو رکورد کنید که خیلی زیاد میشه.من فکر کنم تو شریف این کار انجام شده.تو نارسیس هم برای تلفظ فایل صوتی ظبط کردند که اصلا کار درستی نیست.بعد چک کردن اگه لغت مثلا hello بود برو تویه قسمت فایل صوتی وبخوان.دقیقا بین کلمه های تلفظ شده یه فاصله خالی بود.توی فایل wav مه همراه نرم افزار بود.اما توی بابیلون از فایل ocr استفاده کردند.دانشجوهای شریف هم این کار رو کردن و واقعا کار سختیه.البته هر دو طریق.یعنی هم متن رو به صدا تبدیل کردن و هم صدا رو به متن.البته فارسی.من هر اطلاعات یا راه حلی در این زمینه به نظرم رسید حتما به شما کمک می کنم.موفق باشید.

bobrus
دوشنبه 26 آذر 1386, 17:01 عصر
کسی میدونه این ocr چیه ؟ چه جوری کار می کنه ؟ و چطوری باید ساختش

bobrus
سه شنبه 11 دی 1386, 13:35 عصر
از این که هیچ کس به این تاپیک توجه نمی کنه خوشحالم . همیطوری بوده که تا حالا کسی برنامه ای واسش ننوشته

scorpion_man
سه شنبه 11 دی 1386, 14:39 عصر
با سلام به همه دوستان
اتفاقا تو دانشگاه صنعتی شریف این پروژه انجام گرفته و باید از مراجع دانشگاه پیگیرش باشید
چند روز پیش هم شنیدم که تو بازارم پخش شده ولی منبع موثقی نبود دقیق نمیشه گفت اینیم که یه نفر از دوستان فرمودند انجام شده یک میلیارد هم فروخته شده به نظر من چرته
موفق باشید

mosab_vb
چهارشنبه 12 دی 1386, 01:34 صبح
سلام.در مورد ocr پرسیده بودید.من رو ببخشید که دیر به این تاپیک سر زدم.من منظورتون رو اشتباه متوجه شدم.خیال کردم که می خواین متن روی کاغذ رو بخونین.یعنی برنامه ای که با وب کم متن روی کاغذ رو بخونه.اون فایل ocr برای تبدیل عکس به متنه.توی پردازش تصویر کاربرد داره.اما اینجوری که راحته بخواین متن رو داخل کامپیوتر بنویسین و برنامه براتون بخونه.باید یه قالب رو روی حروف پیاده سازی کنید و اون رو تو بانک صدا پیداش کنید و بخونید.
می خواین یه نمونه ساده آماده می کنم توسایت آپلود می کنم.

bobrus
چهارشنبه 12 دی 1386, 15:15 عصر
برای کلمات معمولی می شه اینکار رو انجام داد ولی برای کلماتی که دوتکه هستند یه چند تا شرط لازمه و مهم اینه که بتونی همه موارد رو در نظر بگیری به هرحال خوشحال می شم یه برنامه آپلود کنی

raravaice
چهارشنبه 12 دی 1386, 16:46 عصر
bobrus عزیز (http://barnamenevis.org/forum/member.php?u=48781)

آقا میشه من این کار رو سال 82 واسه چندتا لغت کردم البته اون موقع vb کار نمیکردم و با نرم افزار بی نظیر Labview نوشتمش البته من اون موقع برنامه نویسی سخت افزار کار میکردم و هنوز روی winform و webform نیومده بودم
مختصر روش کار به این صورت هست :

وقتی صدای یک حرف تولید میشه یه فرکانس خاصی داره یعنی هر حرف توی یه رنج فرکانس خاص تولید میشه : مثال شما حرف م رو هیچ وقت ن نمیشنوی اگر صدای شخص تولید کننده صدا واضح باشه و حالا به این نکته میرسی که هر حرف تو زبان فاسی اعراب هم داره و با توجه به اینکه این اعراب باعث تغییر در فرکانس اصلی حرف سکون میشن پس یک مقدار تغییر میکنه شما کافی یه دیتابیس از صدای حروف به همراه اعراب با یک صدای استاندارد برای خودت درست کنی البته تو Labview قابلیتی که داشت این بود که صدای ورودی رو به صورت یک آرایه یک بعدی برای نوع صدای mono و یک آرایه 2 بعدی برای نوع صدای stereo به من میداد و من این آرایه ها رو تو خود گراف labview دیدم تا به شباهت صدای حروف پی بردم.

حالا چه طور میشه حرف رو تشخیص داد.
قبل از هر چیز اینو بهت بگم که برای ایجاد کیفیت و تشخیص با درصد کم خطا لازم هست از یک کارت صدا و میکرفن خوب استفاده کنی و کسی که میخواد صدا رو در بیاره باید با یک صدای واضح حرف بزنه. و" کلمه به کلمه"
بعد از اینکه شخص کلمه اول رو گفت و به یک مکث رسی آرایه ها توی یه رنج فرکانس پایین میمونن که اگر به شرظ عمل کنی و کارت صدا و میکرفن خوب داشته باشی تا نویز کمی داشته باشه تشخیص اون راحتتره و بعد از تشخیص این مکث کوتاه حالا کافیه که با فرکانس ایجاد شده بازی کنی و با یک سری از توابع خاص و پیشرفته ریاضی و هندسی باید نقاط اوج و افت صدای ایجاد شده رو با صدا های توی بانکت compare کنی و نزدیک ترین صدا ها رو تشخیص بدی.و حرف مربوط رو جایگزین کنی تا یه کلمه از توش در بیاد
حلا برای کمتر کردن ضریب خطا و رسیدن به لغت اصلی باید به بانک از لغات فارسی داشته باشی و این کلمه رو با بانکت مقایسه کنی تا نزدیک ترین واژه رو در بیاری.

البته این مختصرش بود چون الان دیگه تو سرش نیستم ولی اینو میدونم که در قسمت مقایسه امواج صدای شخص با صدا های تو بانک فرمولهای پیچیده ای استفاده میشه.

اینم بگم برنامه نویسی اینکار فوق العاده راحته مسئله اصلی مهارت محز در ریاضی - فیزیک و یک کم هندسه هست

موفق باشی

bobrus
چهارشنبه 12 دی 1386, 19:34 عصر
از توضیحات شما بسیار متشکرم
الان شما راهی سراغ نداری برای انیکه بشه کار شما رو توی vb انجام داد؟

raravaice
چهارشنبه 12 دی 1386, 19:49 عصر
سلام

من تو vb با پردازش voice کار نکردم ولی شما اول از همه یه راهی پیدا کن که صدای ورودی از میکروفن رو به آرایه تبدیل کنه تا بتونی توی اون آرایه نقط اوج و افت فرکانس رو پیدا کنی.

پیشنهاد میکنم یه نسخه از Labview رو برای خودت بگیری تو این مورد به کارت میاد من الان این نرم افزار رو نصب شده ندارم تو شرکت وگرنه DLL اونو برات میفرستادم.

add to your friend list : xvay_com

موفق باشی

amir_saniyan
دوشنبه 01 بهمن 1386, 16:47 عصر
شرکت عصر گویش این کار (تشخیص گفتار زبان فارسی) رو انجام داده و به محصول هم رسیده، تو نسخه 1.0.3 اون بیش از 20000 کلمه فارسی تشخیص داده می‌شه و قیمت اون هم 2.5 میلیون تومنه.
این هم لینک: www.asr-gooyesh.com (http://www.asr-gooyesh.com)
اسم نرم افزار هم نویسا (Nevisa) است.

bobrus
دوشنبه 01 بهمن 1386, 18:51 عصر
پس واجب شد یکی بنویسم

ftmotlagh
شنبه 13 بهمن 1386, 15:46 عصر
آقای باب راس من تاپیک رو خوندم من می خوام اینکارو انجام بدم ...
شما فکر می کنید بهترین راه حل چیه؟؟؟؟
من آمادم...

Mbt925
شنبه 13 بهمن 1386, 16:36 عصر
سوالی که دوستمون پرسیده بودن ، دریافت یه متن و خوندن اون بود.
ولی جوابی که بیشتر دوستان داده بودن برای تشخیص و آنالیز تصویر و از این جور چیزا بود.

راه حلی که خیلی از دوستان ارائه دادن این بود که یه دیتابیس از کلمات تشکیل بدن و هر جا به استثنایی رسیدن اون رو وارد دیتابیس کنن ، این که نشد راه حل ،
با این روش اگه یه متن یا کلمه جدید وارد بشه باید چیکار کرد؟

راه حلی که اصولی تره اینه که مینیمم ترکیباتی که نیازه برای ساخت کلمه و جمله ، نگه داری بشه و بقیه کارها رو یعنی جداسازی حروف ، تشکیل قسمت های معنی دار و اتصال اونا و پخششون به عهده ی برنامه بشه و روی هر چه هوشمندتر شدنش کار بشه.

این پروژه مشکل نیست فقط به وقت نیاز داره.

ftmotlagh
شنبه 13 بهمن 1386, 18:17 عصر
اصلا اگه ما بخوایم یک دیتابیس صوتی درست کنیم ...
حجمش خیلی میره بالا...

ftmotlagh
شنبه 13 بهمن 1386, 18:24 عصر
هر کس حاضر در این پروژه شرکت کنه ...
اعلام آمادگی کنه!

bobrus
یک شنبه 14 بهمن 1386, 14:19 عصر
دوست عزیز از اینکه شما با این انرژی به دنبال برنامه نویسی هستی خوشحالم و از شما ممنونم من خودم وقت خیلی کمی برای کارهای خارج از شرکت دارم بنابراین برای رفع مشکلات در کنار شما خواهم بود امیدوارم به نتیجه برسیم
راه حلی که آقای MBt925 میگه مستلزم اینکه ما دستور زبان فارسی رو به برنامه تبدیل کنیم
در این صورت باید 32 حرف فارسی را در چهار حالت ( فتحه - کسره - ضمه و ساکن ) تلفظ کنیم و چون در فارسی از این علائم استفاده نمی شه تشخیصش با ماست و باید بشینیم تمام کلمات رو تجزیه تحلیل کنیم که این حرف با چه حرفی میاد و با چه حرکتی خوانده میشه و در جاهایی هم باید از جمله بفهمیم که این کلمه چیه :
مثلاً: کلمه (می) هم می تونه ابتدایه یه کلمه باشه(می توان) هم می تونه به تنهایی به کار بره(به معنی شراب). حروف (وا) که گاهی به صورت الف تنها و گاهی کامل خوانده می شن
بنابراین آقای Mbt925 سخترین روش برای اینکار روشی هست که شما گفتین
ولی مهم اینکه آیا این سختی کشیدن ارزش داره روش کار کنیم؟ و آیا حتماً میشه به نتیجه واقعی رسید یا نه؟(منظورم اینه که این استثنا ها اونقد هستند که بشه محدودش کرد و تو یه برنامه نوشت)

ftmotlagh
یک شنبه 14 بهمن 1386, 14:31 عصر
بله منم با نظر شما موافقم ...
من فکر می کنم بهترین راه برای این کار اینکه با یک دیتابیس با پشتیبانی از مثلا 10000 کلمه درست کنیم از آن ها استفاده کنیم...
من خودم شروع به برنامه نویسی کردم...
یه ماهی کار داره.

Mbt925
یک شنبه 14 بهمن 1386, 14:50 عصر
برنامه ای که قراره برای این کار نوشته بشه ، باید انقدر قدرت داشته باشه که بتونه کلمات جدید رو بپذیره.
اگه قرار باشه یه دیتابیس از همه حالات تهیه بشه که دیگه این برنامه اصلا جنبه کدنویسی و الگوریتمیک نداره ، و فقط میشه تهیه دیتابیس.

ftmotlagh
یک شنبه 14 بهمن 1386, 15:00 عصر
کاره دیگه ای برای زبان فارسی نمی شه کرده ... یه راه بسیار آسون دیگه اینه که ما کلمات فارسی رو به Fingilsh تبدیل کنیم و بعد با Speech معمولی ویندوز اجرا کنیم...
که اونم لازمه ی یک دیتابیس حداقل 10000 کلمه ای...؟؟!!!

ABERTINO
یک شنبه 14 بهمن 1386, 19:35 عصر
راه حلی که آقای MBt925 میگه مستلزم اینکه ما دستور زبان فارسی رو به برنامه تبدیل کنیم
در این صورت باید 32 حرف فارسی را در چهار حالت ( فتحه - کسره - ضمه و ساکن ) تلفظ کنیم و چون در فارسی از این علائم استفاده نمی شه تشخیصش با ماست و باید بشینیم تمام کلمات رو تجزیه تحلیل کنیم که این حرف با چه حرفی میاد و با چه حرکتی خوانده میشه و در جاهایی هم باید از جمله بفهمیم که این کلمه چیه :
مثلاً: کلمه (می) هم می تونه ابتدایه یه کلمه باشه(می توان) هم می تونه به تنهایی به کار بره(به معنی شراب). حروف (وا) که گاهی به صورت الف تنها و گاهی کامل خوانده می شن
بنابراین آقای Mbt925 سخترین روش برای اینکار روشی هست که شما گفتین
ولی مهم اینکه آیا این سختی کشیدن ارزش داره روش کار کنیم؟ و آیا حتماً میشه به نتیجه واقعی رسید یا نه؟(منظورم اینه که این استثنا ها اونقد هستند که بشه محدودش کرد و تو یه برنامه نوشت)

آقای mBT925 اگه دقت کرده باشی آقای BOBRUS هم راه حل شما رو توضیح داده ولی به نظرم از این روش نشدنیه چون استثنا تو فارسی زیاد هست مثل انگلیسی نیست اگر هم بشه سرعتش خیلی پایینه

Mbt925
دوشنبه 15 بهمن 1386, 14:35 عصر
آقای mBT925 اگه دقت کرده باشی آقای BOBRUS هم راه حل شما رو توضیح داده ولی به نظرم از این روش نشدنیه چون استثنا تو فارسی زیاد هست مثل انگلیسی نیست اگر هم بشه سرعتش خیلی پایینه

تعداد استثنا ها بیشتر از تعداد کلمات فارسی نیست.

MMR_1344
دوشنبه 15 بهمن 1386, 15:55 عصر
فکر میکنم استثناء ها بسیار باشه
چون زمانها برای فعل مطرح میشه ، صفت و موصوف مطرح میشه و خیلی از مباحث مربوط به زبان فارسی

Mbt925
دوشنبه 15 بهمن 1386, 16:10 عصر
هرکسی ایده خودشو داره.
شما می تونین بشینین و شب و روز کلمه به دیتابیستون اضافه کنید.
شما اگه می خواین این پروژه رو شروع کنید ، شروع کنید و دوستانی هم که دوست دارن و می تونن ، کمکتون می کنن.

bobrus
دوشنبه 15 بهمن 1386, 16:19 عصر
آقای mbt925 من فکر کنم یه چیز رو باید توی اینکار بهش دقت کرد
باید دید که جستجو کردن تو یه بانک کلمات سریعتر انجام میشه یا کنترل مثلاً 1000 شرط پشت سرهم
اون وقت می شه گفت که راه حل شما شدنیه
تازه یه کمی در مورد استثنا ها فکر کنید ببینید چقدر سرسام آور میشه
در آخر هم نظرم اینه که اگه شما راجعه به این قضیه به خوبی فکر کردید و مطمئن هستید که روش شما به نتیجه میرسه یاعلی بگید شروع کنیم به نوشتنش
یعنی شروع کنیم به جمع کردن اطلاعات و یه الگوریتم واسش در بیاریم بعد مشینیم با هم برنامش رو می نویسیم
حداقلش اینکه به سازمان فرهنگ و ارشاد می فروشیمش

ftmotlagh
دوشنبه 15 بهمن 1386, 16:22 عصر
خوب، اول باید ببینیم کدام را سریعتره ...

azarsoft
چهارشنبه 17 بهمن 1386, 18:33 عصر
دوست عزیز از اینکه شما با این انرژی به دنبال برنامه نویسی هستی خوشحالم و از شما ممنونم من خودم وقت خیلی کمی برای کارهای خارج از شرکت دارم بنابراین برای رفع مشکلات در کنار شما خواهم بود امیدوارم به نتیجه برسیم
راه حلی که آقای MBt925 میگه مستلزم اینکه ما دستور زبان فارسی رو به برنامه تبدیل کنیم
در این صورت باید 32 حرف فارسی را در چهار حالت ( فتحه - کسره - ضمه و ساکن ) تلفظ کنیم و چون در فارسی از این علائم استفاده نمی شه تشخیصش با ماست و باید بشینیم تمام کلمات رو تجزیه تحلیل کنیم که این حرف با چه حرفی میاد و با چه حرکتی خوانده میشه و در جاهایی هم باید از جمله بفهمیم که این کلمه چیه :
مثلاً: کلمه (می) هم می تونه ابتدایه یه کلمه باشه(می توان) هم می تونه به تنهایی به کار بره(به معنی شراب). حروف (وا) که گاهی به صورت الف تنها و گاهی کامل خوانده می شن
بنابراین آقای Mbt925 سخترین روش برای اینکار روشی هست که شما گفتین
ولی مهم اینکه آیا این سختی کشیدن ارزش داره روش کار کنیم؟ و آیا حتماً میشه به نتیجه واقعی رسید یا نه؟(منظورم اینه که این استثنا ها اونقد هستند که بشه محدودش کرد و تو یه برنامه نوشت)


من الان مدت چند هفته است روی این پروژه کار می کنم به جاهایی هم رسیدم ولی در جواب این دوستمون و روشی که مطرح کردن باید بگم
اولا هر حرف رو در 7 حالت باید ضبط کنیم
برای مثال :
م - مَ - مِ - مُ - ما - مو - می
این بهترین راه در این روشه که در تلفظ کم نمیاد

دوم : ببینید من این روش رو در حالت های مختلف تست کردم
- در جداسازی و تشخیص حرف ها با صداهای مختلف مشکلی نیست
- در پیداسازی قواعد فارسی و استسناها هم مشکلی نیست
ولی مشکل اساسی در هنگام پخش صدا به وجود میاد یعنی صدا به هیچ شکل بصورت طبیعی اجرا نمیشه و دقیقا مثل نرم افزار های تلفظ انگلیسی پخش میشه که در این روش بهترهه به قول دوستمون که پیشنهاد داده کلمات رو به فینگلیشی تبدیل و بعد تلفظ کنیم استفاده کنیم .
ولی از طرفی هم منطقی ترین روش همین روشی که باید مشکلی که گفتم روش حل بشه .

به هر حال من دنبال روش هایی برای حل این مشکل هستم از دوستان کسی اگه راه حلی داره بگه یک تستی بزنیم و نتیجه رو بگیم .
به هر حال تا اینجا رو داشته باشید تا بعد

rostamkhani
چهارشنبه 17 بهمن 1386, 22:36 عصر
اگه میخواین یه چیزه درست حسابی بنویسین باید در زمینه DSP کار کنین
Digital Signal Processing

بچه ها این ببینید جالبه
http://barnamenevis.org/forum/showthread.php?t=5849

کتابی معروف درباره Digital Signal Processing
http://rapidshare.de/files/7789875/McGraw.Hill.Professional.LabVIEW.Digital.Signal.Pr ocessing.May.2005.eBook-BBL.rar

دانلود کتاب در موضوع مورد نظر
http://search.gigapedia.org/items?q=digital%20signal%20processing

یک مثال از DSP در vb
از سایت www.vbfrance.com (http://www.vbfrance.com)
http://www.vbfrance.com/codes/CREER-ECHO_34857.aspx

ftmotlagh
پنج شنبه 18 بهمن 1386, 13:26 عصر
من الان مدت چند هفته است روی این پروژه کار می کنم به جاهایی هم رسیدم ولی در جواب این دوستمون و روشی که مطرح کردن باید بگم
اولا هر حرف رو در 7 حالت باید ضبط کنیم
برای مثال :
م - مَ - مِ - مُ - ما - مو - می
این بهترین راه در این روشه که در تلفظ کم نمیاد

دوم : ببینید من این روش رو در حالت های مختلف تست کردم
- در جداسازی و تشخیص حرف ها با صداهای مختلف مشکلی نیست
- در پیداسازی قواعد فارسی و استسناها هم مشکلی نیست
ولی مشکل اساسی در هنگام پخش صدا به وجود میاد یعنی صدا به هیچ شکل بصورت طبیعی اجرا نمیشه و دقیقا مثل نرم افزار های تلفظ انگلیسی پخش میشه که در این روش بهترهه به قول دوستمون که پیشنهاد داده کلمات رو به فینگلیشی تبدیل و بعد تلفظ کنیم استفاده کنیم .
ولی از طرفی هم منطقی ترین روش همین روشی که باید مشکلی که گفتم روش حل بشه .

به هر حال من دنبال روش هایی برای حل این مشکل هستم از دوستان کسی اگه راه حلی داره بگه یک تستی بزنیم و نتیجه رو بگیم .
به هر حال تا اینجا رو داشته باشید تا بعد


شما چه جوری می خواین تشخیص بدید که یک حرف صدای مَ یا مُ ؟؟؟؟؟؟

azarsoft
جمعه 19 بهمن 1386, 14:28 عصر
شما چه جوری می خواین تشخیص بدید که یک حرف صدای مَ یا مُ ؟؟؟؟؟؟

خیلی ساده است
اگر کمی به عقب یعنی سالهای راهنمایی بر گردی و مروری بر فارسی و عربی اون زمان بکنی می فهمی که هر حرفی قبل و بعد خاصی دارد مانند:

بعد از هر حرفی اگر ( ا) بیاد اون حرف در صیغه چهارم خوانده می شود مثال :

مادر = م +ادر در تلفظ حرف ( ا ) کسر و ( م )در صیغه چهارم یعنی ( ما ) خوانده می شود .
مار - ماسه - ماشین - ماه - مازندران - ماکو - مانده - ماهی
یا هر گاه بعد از ( م ) حرف ( ب ) بیاد ( م ) بصورت ( مُ ) خوانده می شود
مثال :
مبارک - مبالغه - مبارزه - مباهات - مباشر - مبتدا - مبتذل - مبتکر - مبتلا
استسنا : مبحث - مبدا ، که در استسناها ( م ) بصورت ( مَ ) خوانده می شود که این هم به خاطر حرف سوم بی صدا است .
در بیشتر استسناها حرف مورد نظر ( َ ) می گیرد (فتحه )
اگر این قواعد رو به درستی بتونیم پیدا کنیم در تشخیص کلمات مشکلی پیش نمیاد .

البته استسناهایی هم وجود دارد که باید لیستی از استسناها رو به وجود بیاریم.

اگه بخواهی ساده تر بگم از قواعد دستور زبان فارسی استفاده می کنیم .

ftmotlagh
یک شنبه 21 بهمن 1386, 23:09 عصر
اینجوری هم یه دیتابیس برای صداها می خوایم و یک دیتابیس برای استثناها و یه عالمه برنامه نویسی و الگوریتم اگه ما یک دیتابیس 10000 کلمه ای بسازیم که بهتره که اونم مشکلات خودشو داره...

azarsoft
دوشنبه 22 بهمن 1386, 00:14 صبح
اینجوری هم یه دیتابیس برای صداها می خوایم و یک دیتابیس برای استثناها و یه عالمه برنامه نویسی و الگوریتم اگه ما یک دیتابیس 10000 کلمه ای بسازیم که بهتره که اونم مشکلات خودشو داره...

دوست عزیز برنامه نویسی یعنی همین دیگه
در روشی که من گفتم شما نهایتا 300 حرف رو ضبط می کنید و چند خط بیشتر برنامه نویسی می کنید ولی در عوض سیستمی به وجود میارید که میشه به راحتی صدای شخص رو تو اون شبیه سازی کرد و صداهای دیگری رو نیز جایگزین نمود ولی در روشی که شما بیان می کنید اولا برای اینکه دیتابیس کاملی داشته باشید حداقل باید صد هزار کلمه رو ضبط کنید دوما هر بار که خواستید صدای برنامه رو تغییر بدهید باید از نوع صد هزار کلمه را ضبط کنید ( برای مثال پخش صدای مرد و زن و هر شخص دیگری که می خواهد تن صدایش توسط کامپیوتر شبیه سازی شود ) سوما برنامه شما فقط بصورت کتابی می خواند و نوشته ها و کلمات جدید رو نمی تونه بخوند در روشی که من می گم حتی کلمات و جملات بی معنی نیز قابلیت خواندن دارند

ABERTINO
دوشنبه 22 بهمن 1386, 09:40 صبح
آقای Azarsof باشما کاملاً موافقم فقط اگه یه لطفی بکنید و راهنمایی کنید که از چه منابعی استفاده کردید ممنون میشم چون من هم به شدت دنبال یه همچین مطلبی هستم

ftmotlagh
دوشنبه 22 بهمن 1386, 13:34 عصر
بله این راه منطقی تره ...
حق با شماست.

azarsoft
دوشنبه 22 بهمن 1386, 15:45 عصر
آقای Azarsof باشما کاملاً موافقم فقط اگه یه لطفی بکنید و راهنمایی کنید که از چه منابعی استفاده کردید ممنون میشم چون من هم به شدت دنبال یه همچین مطلبی هستم

ببینید من چند سال پیش یعنی دوره هنرستان این طرح رو به عنوان پروژه پایانی انتخاب کرده بودم البته اون زمان روی داس و محیطهای برنامه نویسی داس می خواستم چنین کاری رو بکنم و هدفم ایجاد صدا با فرکانسهای تولیدی توسط کامپیوتر بود ( البته اون موقع به علت ضعف برنامه نویسی و نداشتن حامی خوبی دست از این کار برداشتم ) و همون زمان طی بررسی هایی که کردم و مطالعه هایی که نمودم به یک کتاب به اسم " چگونه فارسی بخوانیم و تلفظ کنیم : حالا دقیق یادم نیست اسمش شاید کمی فرق داشت ولی به هر حال مطالبی توی اون کتاب مبنی برا حروف صدادار و بی صدا و حرفهای صدا دار خواندم البته الان اون کتاب رو ندارم ولی بخش مربوط به تلفظ و حرکات رو یاداشت برداری کردم ( بخشی از ههمین موارد رو طی سالهای تحصیل از همان سال اول توی کتاب فارسی و بعد ها در دستور زبان فارسی و حتی در عربی هم خواندیم ( تلفظ عربی و فارسی شباهات بسیار زیادی دارد )

حالا اگر شما بتونید این قواعد رو سر هم بیارید و بصورت یک تابع دربیارید خیلی ساده می تویند این برنامه رو بنویسید .
البته من هنوز سر این موضوع که صدای تولید شده و پخش شده زیاد طبیعی نمیشه اسرار دارم و دنبال راه حلی برای این موضوع هستم ، تقریبا همه قسمتهای تشخیص و جدا سازی کلمات رو طراحی و پیداه سازی کردم و فقط مشکلم سر همین تلفظ غیر طبیعی است . و چون سرم در شرکت شلوغه نمی رسم بقیه کارهاش رو بکنم و زیاد روش کار کنم

حالا شما دوست عزیز یا هر یک از سایر دوستانمان قصد دارد روی این پروژه کار کند حاضرم باهاش همکاری کنم و می تونم هر امکانی که بخواهید تو محل شرکت در اختیارتون بذارم .

جهت ارتباط با من می تونید از میل زیر استفاده کنید :
Azarsoft@gmail.com

rostamkhani
پنج شنبه 25 بهمن 1386, 00:26 صبح
بنده هم یه همچین کار رو انجم داردم نه در حد کامل برای تمامی حروف در حد تست
دقیقا اولین مشکل اون غیر طبیعی بودن اون که خیلی مهم و اعمال سوالی بودن یا تعجب آمیز بودن جمله و غیره که در speech های microsoft موجود است
بعد با برسی بیشتر به این نتیجه رسیدم باید برای نوشتن یه چیز درست حسابی
در زمینه DSP به طور حرفه ای کار کرد .
موفق باشید

azarsoft
پنج شنبه 25 بهمن 1386, 14:48 عصر
بنده هم یه همچین کار رو انجم داردم نه در حد کامل برای تمامی حروف در حد تست
دقیقا اولین مشکل اون غیر طبیعی بودن اون که خیلی مهم و اعمال سوالی بودن یا تعجب آمیز بودن جمله و غیره که در speech های microsoft موجود است
بعد با برسی بیشتر به این نتیجه رسیدم باید برای نوشتن یه چیز درست حسابی
در زمینه DSP به طور حرفه ای کار کرد .
موفق باشید

دوست عزیز مبحث پردازش دیجیتالی صدا هم کمک زیادی نمی کنه چون هنوز این مشکل غیر طبیعی بودن صدا روی زبان انگلیسی هم هست و نتونستن حلش کن .
با کامپیوتر و تولید کننده های دیجیتالی صدا نمی توان به راحتی صدایی مشابه صدایی که از هنجره انسان درمیاد تولید کرد.

البته هیچ کاری نشد نداره باید بیشتر سعی کنیم و بیشتر فورمول نویسی کنیم .
بازم می گم من حاضرم روی این پروژه با همه دوستانی که تمایل دارند همکاری کنم .

AlirezaSaberi
جمعه 26 بهمن 1386, 11:59 صبح
سلام دوستان
من این تاپیک رو تازه دیدم و همه پست های اونو خوندم
1)اول گله کنم که خیلی از دوستان اصلا موضوع رو متوجه نشدن باز جای شکرش باقیه که خیلی از پست ها توسط مدیران حذف شد!
2)یک بحثی اول تاپیک بود که این کار شده و به فلان جا یک میلیارد فروخته شده. من فروخته شدنش رو باور میکنم ولی تولید شدنش رو باور نمیکنم
3) برای هر پروژه ای باید اول از همه به مساله اشراف کامل داشت بنابر این حتما با متخصصان زبان فارسی مشورت کرد همونطور که دوست عزیزمون azarsoft اشاره کرد
4) از لحاظ فنی الگوریتم azarsoft بسیار منطقی تر و اجرایی تر از بقیه راه حل ها میاد و بعد از اون بانک و تبدیل کلمات به filnglish که البته نظر من تبدیل اونها به فونتیک کلماته
5) غیر طبیعی بودن صداجدای از فرکانس صدا به شکل موج صدا و هارمونی های زمینه اون بستگی داره .ثل اینکه همه خوانندگان موسیقی نت سی رو درست تلفظ میکنن ولی هیچکدوم مثل هم تلفظ نمیکنن. نکته دوم احساسیه که پشت تلفظ نهفته است. خلاصه بگم حرف میم توی کلمه مار و مامان مثل هم تلفظ نمیشه و حرف ج توی جیغ و جیگر هم مثل هم تلفظ نمیشه و احساس خاصی رو القا میکنن
تازه به قولی ما آذری ها چند نوع کاف داریم ...


موفق باشید
کار نشد نداره مخصوصا توی بحث تکنولوژی