سه شنبه ۳۰ ارديبهشت ۱۳۸۲
سال يازدهم - شماره ۳۰۵۴
مقاله
Front Page

مروري بر نرم افزارهاي تشخيص صدا
001400.jpg

دستور دادن از طريق صدا به رايانه هميشه جزء يكي از آرزوهاي متخصصان و مردم عادي بوده است. در تمام فيلم هاي علمي تخيلي صحنه هايي كه انسان با ماشين به گفت وگو مي پردازد فراوان ديده مي شود. در حال حاضر مطمئن ترين روش ورود اطلاعات از طريق ابزار لمسي مانند صفحه كليد يا موش به رايانه است. در حقيقت با گذشت نزديك به نيم قرن از ساخته شدن ابتدايي ترين ماشين هاي هوشمند تاكنون تغيير اساسي در نحوه ارتباط با اين ابزار به وجود نيامده است. نرم افزارهاي تشخيص صدا مدت زيادي است كه وارد دنياي فناوري اطلاعات شده اند اما هنوز تحولاتي كه از آنها انتظار مي رفت را بوجود نياورده اند. در مقاله زير به معرفي و مقايسه دو نرم افزار مطرح در اين زمينه مي پردازيم.
IBM Via Voice 10
بعيد است كسي با موتورهاي تشخيص صدا سروكار داشته باشد و نام Via Voice را نشنيده باشد. IBM اولين شركت بزرگي بود كه با صرف سرمايه  فراوان موفق شد نرم افزارهاي تشخيص صدا را تهيه كند. كساني كه با ويندوز و بسته نرم افزاري آفيس XP كار كرده باشند. حتماً مي دانند كه ابزار ديكته كردن متون و اجرا بعضي از دستورات در محيط نرم افزار آفيس وجود دارد. البته اكثر كاربران از اين امكانات استفاده نمي كنند و دليل آن را دشواري و در پاره اي اوقات پيچيدگي بيش از حد اين ابزار است. به هر ترتيب مايكروسافت نيز زماني كه تصميم گرفت چنين قابليتي به نرم افزارهاي خود اضافه كند از تجربيات IBM استفاده هاي زيادي كرد. نرم افزار Via Voice هم اكنون انتشار دهمين نسخه خود را جشن گرفته است و با توجه به قيمت آن در حدود ۲۰۰ دلار آمريكا انتخاب اول بسياري از كاربران است. اگر شما در زمينه كاركردن با موتورهاي تشخيص صدا تازه كار هستيد سعي كنيد اولين نرم افزاري كه امتحان مي كنيد حتماً Via Voice باشد. اين نرم افزار شما را با نكات ريز و ظريف موتورهاي تشخيص صدا آشنا مي كند و مي تواند تجربه خوبي براي شما دراين زمينه بوجود آورد.
001410.jpg

يكي از نكات مهم در مورد كاركردن با اين دسته نرم افزار ها توجه به خريد يك ميكروفون عالي است. نرم افزارهاي تشخيص صدا وابستگي حدود ۶۰ درصد به ميكروفون دارد. اگر شما بسته نرم افزاري Via Voice را تهيه كنيد يك ميكروفون DSP بسيار قدرتمند و البته گران قيمت (در حدود ۸۰ هزار تومان) در داخل بسته نرم افزاري وجود دارد. اما چون معمولاً در ايران كسي عادت به خريد بسته اصلي نرم افزارها را ندارد و اگر واقعاً قصد استفاده جدي از چنين نرم افزارهايي را داريد بهتر است زير بار خريد يك ميكروفون خوب برويد و گرنه با مشكلات جدي در حين كار رو به رو خواهيد شد. بعد از تهيه ميكروفون بايد سراغ نصب اين برنامه برويم. دقت كنيد حتماً بايد قبل از نصب نرم افزار ميكروفون مناسب را تهيه كنيد زيرا در حين مراحل نصب حتماً به آن احتياج خواهيد داشت و امكان اينكه مثلاً بايد ميكروفون معمولي نرم افزار را نصب كنيد و بخواهيد ميكروفون ديگري تهيه كنيد وجود ندارد و عملاً به كارايي لازم دست نخواهيد يافت.
دقت كنيد نصب كردن نرم افزارهاي تشخيص بسيار مهم و حياتي است. اگر مراحل نصب را با حوصله و دقت لازم طي نكنيد هميشه در استفاده از نرم افزار مشكل خواهيد داشت.
در مورد Via Voice بايد بگوييم در هنگام نصب اين نرم افزار كمترين مشكل را نسبت به نرم افزارهاي مشابه خواهيد داشت.
همانطور كه اطلاع داريد در مرحله نصب نرم افزارهاي تشخيص صدا معمولاً كاربران بايد يك متن را براي تشخيص نوع ادا كردن حروف براي رايانه بخوانند. اين مرحله كه نرم افزار در آن به صورت مصنوعي به صداي شما عادت مي كند بسيار مهم است. بنابر اين اگر به هر دليلي مانند بيماري صداي شما در حالت عادي قرار ندارد نصب كردن اين برنامه را به وقت ديگري موكول كنيد. اين مرحله براي يك كاربر معمولي و مسلط به زبان انگليسي در حدود ۱۵ دقيقه طول مي كشد. يكي از سؤالاتي كه هميشه براي كاربران به وجود مي آيد مسأله لهجه و مشكلاتي است كه برخي افراد در هنگام تلفظ و تشخيص صداي آنها توسط رايانه دارند. تاكنون هيچ كس نتوانسته ادعا كند نرم افزار تشخيص صدايي طراحي كرده است كه همه افراد بتوانند استفاده كنند. طبيعتاً هرچه لهجه شما و نحوه تلفظ كلمات صحيح تر باشد كار با اين برنامه ها راحت تر خواهد بود. هنگامي كه سايت هاي مخصوص بررسي نرم افزارها تشخيص صدا را مرور مي كرديم مشاهده كرديم اكثر سايت ها ميزان ۹۶ درصد تشخيص صحيح براي اين نرم افزار در نظر گرفته اند و تنها ۴ درصد احتمال خطا براي آن قائل شده اند. ولي هنگامي كه نظرات كاربران در مورد اين نرم افزار را بررسي كرديم عددي در حدود ۷۰ درصد به دست آمد. بنابر اين مي توان گفت هنوز اين نرم افزارها با موفقيت كامل فاصله زيادي دارند. اگر واقعاً همانطور كه شركت هاي تهيه كننده اين نرم افزارها ادعا مي كنند درصد خطاي اين نرم افزارها ۴ درصد باشد استفاده نكردن اكثر كاربران از آنها جاي تعجب بسيار زيادي دارد.
001415.jpg

بعد از نصب Via Voice شما با يك نوار ابزار مانند نوار ابزار Language ويندوز سروكار داريد. البته براي نصب اين برنامه نيز نياز به حداقل ۶۰۰ مگابايت فضاي خالي از ديسك سخت داريد. مانند اكثر برنامه هاي ديكته ستون به رايانه شما ابزارهاي جانبي مانند مبدل متن به صدا و همين طور امكان اجراي بعضي از دستورات برنامه ها توسط صدا را داريد. يكي از جالب ترين امكانات Via Voice10 امكان درك كردن ميانبر براي تمام برنامه هاي ويندوز است. شما مي توانيد براي تمام برنامه هاي خود ميانبر (ShortCut) با صدا ايجاد كنيد و با صدا كردن نام برنامه ها آنها را اجرا كنيد. همانند نسخه هاي گذشته Via Voice سعي كرده است بيشتر امكانات خود را به برنامه word مايكروسافت اختصاص دهد ولي در كنار آنها مرورگر اينترنت نت اسكيپ و مرورگر Opera نيز توسط اين برنامه قابل كنترل هستند. امكان جالب ديگر اين است كه هنگامي كه شما مثلاً مشغول تماشاي يك صفحه وب هستيد و چندين لينك در آنها صفحه وجود دارد شما مي توانيد با خواندن نام لينك ها به روي آنها كليك كنيد و به صفحه بعد برويد. در ضمن تمام كنترل هاي روي يك صفحه وب مانند دستور Scroll و يا Back و Forward توسط صدا اجرا خواهند شد كه براي وبگردهاي حرفه اي مي تواند كمك بزرگي باشد.
اگر با نسخه هاي قديمي Via Voice كار كرده باشيد حتماً مشاهده كرده ايد در هنگام ديكته كردن متن به رايانه پس از گرفتن يك كلمه چند لحظه كوتاه تا تايپ شدن آن در برنامه اديتور زمان لازم بود ولي در نسخه ۱۰ اين عيب به صورت كامل حل شده است.
ولي حتماً دقت كنيد براي اجرا كردن اين برنامه با بهترين كيفيت حداقل به يك پردازنده پنتيوم ۴ و ۲۵۶ مگابايت فضاي رم احتياج خواهيد داشت. اما در صورتي كه فرهنگ واژگان بزرگVia Voice لغت مورد نظر شما را نداشته باشد امكان ياد دادن كلمات به اين برنامه نيز وجود دارد كه البته چندان قدرتمند و كارآمد نيست. كارشناسان سايت Zdnet و Cnet به طور كلي به اين نرم افزار نمره ۵/۸ از ۱۰ را داده اند كه نشانگر صعود و كارايي بالاي اين نرم افزار نسبت به نرم افزارهاي مشابه خود است.
Dragon Natarally Spealing 6
گرچه بسياري از متخصصان سعي كردند به كاربران توصيه كنند از Dragon به جاي Via Voice استفاده كنند اما اين نرم افزار هيچگاه نتوانست به صورت جدي با برنامه IBM رقابت كند براي استفاده كردن از Dragon شما به امكانات سخت افزاري كمتري احتياج داريد. يك پردازنده پنتيوم ۳ به همراه ۱۲۸ مگابايت حافظه رم براي اجراي اين برنامه كافي است. نصب كردن آن شباهت زيادي به Via دارد و بسيار ساده است. ولي بعد از نصب ديگر اوضاع چندان خوب نيست. در طي بررسي هاي به عمل آمده از هر ۱۰۰ كلمه ديكته شده توسط اين برنامه ۸ لغت اشتباه تايپ مي شود و علاوه برآن اين برنامه از مرورگر Netscape و امكان كليك بر روي لينك ها نيز بي بهره است.
در مورد امكانات جانبي در پاره اي در مواقع Dragon از Via Voice بهتر است. مثلاً بعد از تبديل شدن يك متن به يك فايل صوتي توسط اين برنامه شما با صداي انسان سروكار خواهيد داشت در صورتي كه در Via Voice اين گونه نيست. اما تلاش هايي براي ساختن يك موتور تشخيص صدا در ايران هم انجام شده است. در حدود يك سال پيش نيز نرم افزار تشخيص صداي فارسي توسط پژوهشكده پردازش هوشمند وزارت علوم ارائه شد. ولي هيچگاه به صورت گسترده به بازار عرضه نشد. خوشبختانه ما شانس استفاده و آزمايش اين برنامه را داشتيم و متأسفانه متوجه شديم چرا بالاخره اين نرم افزار به صورت عمومي عرضه نشد. مطمئناً استفاده از چنين نرم افزارهايي تأثير زيادي در توليد محتواي فارسي در اينترنت خواهند داشت.

پرسش و پاسخ
Abrishamchi@hamshahri.org
*تصاوير تكرنگ با فرمت JPeg ذخيره كرده ام اما نمي توانم در فتوشاپ آنها را رنگ آميزي كنم.
001395.jpg

مهدي علمدار
احتمالا تصوير شما در Gray scale Mode قرار دارد. در فتوشاپ ابتدا Mode تصوير را به RGB يا CMYK تغيير دهيد و سپس تغييرات مورد نظرتان را بر روي تصوير اعمال كنيد.
*در مورد امكانات Speech ويندوز XP توضيح دهيد.
حسين رحيمي
اين شماره در مورد نرم افزارهاي تشخيص صدا در مقاله به صورت مفصل صحبت كرده ايم. در ويندوز XP نيز امكانات بسيار كوچكي براي ديكته متن در نرم افزارهاي Office و همين طور براي اجراي بعضي دستورات پيش بيني شده است. اول اينكه اين امكانات فقط براي زبان انگليسي وجود دارد. دوم اينكه موتور تشخيص صداي ويندوز بسيار ضعيف و ابتدايي است و كاركرد جدي ندارد. اين موتور تشخيص صدا به صورت پيشرفته تر در بسته نرم افزاري Plus ويندوز وجود دارد كه آن هم كاربرد عملي چنداني ندارد. ولي به هر ترتيب شما مي توانيد بامراجعه به گزينه Speech در كنترل پنل و ايجاد يك شناسه و انجام تمرينات لازم اقدام به راه اندازي يك شناسه در اين قسمت كنيد.
001405.jpg

*چگونه مي توان در يك بانك اطلاعاتي Access فايل هاي تصويري ذخيره كرد؟
در حين طراحي جدول هاي مربوط به نگهداري اطلاعات يك فيلد را به صورت OLE object معرفي كنيد. سپس در VIEW نرمال بر روي فيلدمزبوركليك راست انجام دهيد و نوع فايلي را كه مي خواهيد در اين فيلد قرار بگيرد مشخص كنيد. انواع تصاوير و فرمت هاي ديگر را مي توانيد به اين صورت در يك بانك اطلاعاتي به راحتي نگهداري كنيد.
*سيستمي را معرفي كنيد كه بتوان در آن زبانهاي گوناگون را به يكديگر ترجمه كرد.
به تازگي سايتهاي زيادي براي ترجمه متن ها به زبان هاي گوناگون راه اندازي شده است. اما به نظر ما سايت ترجمه همزمان google در اين زمينه بسيار قوي عمل كرده است. با مراجعه به آدرس www.Google.Com/language_tools مي توانيد متن خود را به ۳۷ زبان دنيا ترجمه كنيد. البته كيفيت ترجمه قطعا بالا نخواهد بود ولي اين كار مي تواند تا حد زيادي مطالب را در زبان هاي ديگر قابل فهم كند. براي زبان فارسي نيز متأسفانه امكاناتي به اين شكل وجود ندارد. اميدواريم هر چه زودتر مؤسسات و يا كارشناسان ما دست به كار شوند و اين خدمت بزرگ را براي كشورشان انجام دهند.

|  آموزش  |   خبر  |   گزارش  |   گوناگون  |   مسابقه انفورماتيك  |   مقاله  |

|   آرشيو انفورماتيك   |   شناسنامه   |   بازگشت   |