واقع در:
![]()
طراحی و پیادهسازی سیستم تبدیل متن به گفتار در زبان کردی (پایان نامه) (1388) / بارخدا ، وفا، نویسنده
![]()
نوع مدرک: متون چاپی سرشناسه بارخدا ، وفا، نویسنده عنوان : طراحی و پیادهسازی سیستم تبدیل متن به گفتار در زبان کردی (پایان نامه) تکرار نام مولف : وفا بارخدا ناشر: سنندج : کردستان سال نشر : 1388 ناشر دیگر : مهندسی صفحه شمار: 128ص ویژگی : جدول، مصور، عکس یادداشت زبان: فارسی کتابنامه،واژه نامه و نمایه کتابنامه:ص. 123-128 توصیفگرها هجا و دایفون واج گونه روش های اتصالی زبان کردی سیستم تبدیل متن به گفتار چکیده : چکیده رویه تبدیل متن به گفتار از دو بخش اصلی سطح بالا (تحلیل متن) و سطح پایین (تولید گفتار) تشکیل شده است. در قسمت سطح بالا، متن ورودی به شکلی درمیصآید که در مرحله دوم قابل استفاده باشد. تا به حال روشصهای گوناگونی برای تولید گفتار در قسمت سطح پایین به کار رفته است که در این میان سه روش تولیدی، مبتنی بر فرمنت و اتصالی بیشترین کاربرد را داشتهصاند. روش مبتنی بر فرمنت بر اساس اختلاف فرمنتصها در اصوات مختلف کار کرده و در طی دههصهای گذشته بیشترین استفاده را داشته است. با این وجود در سالصهای اخیر روش اتصالی که بر اساس اتصال واحدهای از پیش ضبط شده کار میصکند، محبوبیت بیشتری یافتهصاند. به لحاظ نظری، دقیقصترین و کاملصترین روش برای تولید گفتار، روش تولیدی است که بر اساس مدل کردن دستگاه تولید گفتار انسان کار میصکند. با این وجود به لحاظ عملی این روش هنوز دارای پیچیدگیصهای زیادی بوده و بنابراین زیاد مورد استفاده قرار نگرفته است. در طول دههصهای اخیر و همزمان با توسعه روشصهای تبدیل متن به گفتار، این سیستمصها در حوزهصهای بیشتری کاربرد پیدا کردهصاند. گفتار مصنوعی میصتواند به منظور خواندن پستصهای الکترونیکی، کاربرد در ابزارهای چندرسانهصای و به طور خلاصه برای تعامل بین انسان و ماشین به کار رود. علاوه بر این موارد، ارزیابی کیفیت گفتار تولید شده هم یکی دیگر از پارامترهای بسیار مهم است که البته به سادگی قابل دستیابی نیست. به همین منظور بازه گستردهصای از روشصهای ارزیابی به وجود آمدهصاند که هر کدام برخی از جنبهصهای گفتار را مورد بررسی قرار میصدهند. امروزه برای بسیاری از زبانصهای دنیا، سیستمصهای تبدیل متن به گفتار با کیفیتصهای مختلف به وجود آمده است. در این پایانصنامه، ما سه سیستم مختلف تبدیل متن به گفتار را برای زبان کردی و بر اساس واحدهای واجصگونه، هجا و دایفون طراحی و پیادهصسازی کردهصایم. در هر سه این سیستمصها از روشص اتصالی برای تولید گفتار استفاده شده است. شرح مختصری از هر کدام از این سیستمصها و واحدهایشان به همراه ویژگیصهای خاص زبان کردی بیان شده است. همچنین نحوه تولید اطلاعات نوایی و راهکارهایی برای افزایش میزان طبیعی بودن گفتار تولید شده ارائه شده است. در نهایت هم چالش های موجود و کارهایی که در آینده می تواند در راستای تکمیل این پایانصنامه انجام گیرد مورد بررسی قرار گرفته اند. کلمات کلیدی: سیستم تبدیل متن به گفتار، زبان کردی، روش های اتصالی، واج گونه، هجا و دایفون
ABSTRACT The text-to-speech procedure consists of two main phases, usually called high- and low-level synthesis. In high-level synthesis the input text is converted into such form that the low-level synthesizer can produce the output speech. The three basic methods for low-level synthesis are the formant, concatenative, and Articulatory synthesis. The formant synthesis is based on the modeling of the resonances in the vocal tract and is perhaps the most commonly used during last decades. However, the concatenative synthesis which is based on playing prerecorded samples from natural speech is becoming more popular. In theory, the most accurate method is Articulatory synthesis which models the human speech production system directly, but it is also the most difficult approach. Since the quality of synthetic speech is improving steadily, the application field is also expanding rapidly. Synthetic speech may be used to read e-mail and mobile messages, in multimedia applications, or in any kind of human-machine interaction. The evaluation of synthetic speech is also an important issue, but difficult because the speech quality is a very multidimensional term. This has led to the large number of different tests and methods to evaluate different features in speech. Today, speech synthesizers of various qualities are available as several different products for all common languages. In this thesis, we design and implement three Kurdish Text-to-Speech (TTS) systems based on allophone, syllable, and diphone. These systems are based on the state of the art of concatenate speech synthesizers. A brief review of the major systems components are presented with some emphasis on the features that are relevant to the Kurdish language. In particular, how to generate prosodic information for improving naturalness and intelligibility of Kurdish TTS output are studied. Remaining challenges and future research directions are also discussed. Key-words: Text-to-Speech system, Kurdish language, Concatenative method, Diphone, Syllable, and Allophoneلینک فایل دیجیتالی : https://libapp.uok.ac.ir/faces/search/bibliographic/biblioFullView.jspx?_afPfm=1 [...] لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=15875 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت فاقد شماره ثبت ![]()
ارائه الگوریتمهای ریشه یاب و غلط گیر برای متون زبان کردی (پایان نامه) (1392) / صلواتی ، شاهین، نویسنده
![]()
نوع مدرک: متون چاپی سرشناسه صلواتی ، شاهین، نویسنده عنوان : ارائه الگوریتمهای ریشه یاب و غلط گیر برای متون زبان کردی (پایان نامه) تکرار نام مولف : شاهین صلواتی ناشر: سنندج : کردستان سال نشر : 1392 ناشر دیگر : مهندسی صفحه شمار: ط، 124 ص ویژگی : مصور، جدول، نمودار یادداشت زبان: فارسی کتابنامه،واژه نامه و نمایه کتابنامه: ص. 124-119 توصیفگرها غلطگیری هستهیابی ریشهیابی پردازش زبان طبیعی بازیابی اطلاعات زبان کردی چکیده : زبان کردی که در دسته زبانهای هندواروپایی میباشد، توسط ساکنان مناطق وسیعی در کشورهای ایران، عراق، ترکیه و سوریه مورد تکلم قرار میگیرد. علیرغم جمعیت بالای متکلمان زبان کردی، این زبان در دسته زبانهای کم منبع قرار دارد و چندان مورد توجه پژوهشگران حوزه پردازش زبان به ویژه بازیابی اطلاعات و پردازش زبان طبیعی قرار نگرفته است. بر همین اساس، با هدف ارائه راهحل و رفع مشکل تنک بودن منابع، اخیرا پروژه پردازش زبان کردی)KLPP(در دانشگاه کردستان شروع به کار کرده است. هدف اصلی پروژه، ارائه منابع و ابزارهای ضروری برای پردازش متون زبان کردی میباشد. این گزارش، خروجیهای یک پایاننامه ارشد را که در چارچوب KLPP به انجام رسیده است، گزارش میکند. اولین خروجی این پروژه، مجموعه پیوان است، که شامل تعداد زیادی از اسناد نوشته شده به سورانی و کرمانجی دوگویش اصلی زبان کردی- میباشد. این مجموعه یک منبع زبانشناسی غنی محسوب میشود و بصورت گسترده در تمامی بخشهای این پایاننامه برای تسهیل توسعه سایر ابزاها مورد استفاده قرار گرفته است. به دنبال ساخت این مجموعه اسناد، ما مجموعه آزمون پیوان را به عنوان یک سنگ محک برای سیستمهای بازیابی اطلاعات کردی، ایجاد میکنیم. پس از تولید این پیشنیاز ضروری، ما بر روی اهداف اصلی این پایاننامه، که شامل ساخت یک ریشهیاب، یک هستهیاب و یک غلطگیر، برای زبان کردی به طور عام و برای گویش سورانی به طور خاص میباشد، تمرکز میکنیم. برای این هدف، ابتدا ژیدهر، یک ریشهیاب مبتنی برقاعده (پشتیبانی کننده از هر دو گویش سورانی و کرمانجی) ایجاد و تاثیر آن را بر بهبود کارایی موتورهای جستجوی کردی نشان میدهیم. سپس، پهیو ، یک هستهیاب مستقل از فرهنگ لغت را ارائه میکنیم، که توانایی استخراج هسته کلمات مشتق (افعال یا اسامی) را دارد. پهیو ، مبتنی بر مجموعهای از قواعد ساختواژه میباشد، که آنها را از گویش سورانی گردآوری کردهایم. در نهایت، رینووس را که یک ابزار غلطگیر متون سورانی میباشد، ارائه میکنیم. غلطگیر از روشهای آماری، مبتنی برقاعده و فرهنگ لغت بهره میبرد. رینووس تنها برای تشخیص کلمات اشتباه ارائه نشده است، بلکه میتواند یک لیست از جایگزینهای بالقوه را به کاربر پیشنهاد کند. بسیار علاقهمندیم به این نکته اشاره شود که تمامی راهحلهای ارائه شده در این پایاننامه، پیادهسازی و کارایی آنها به صورت تجربی از طریق مطالعات آزمایشی مختلف بررسی شده است. اضافه بر آن، تمامی منابع زبانشناسی و ابزارهای نرمافزاری ارائه شده در طول این پایاننامه، به صورت دسترسی آزاد، در اختیار جامعه پژوهشی قرار گرفته است. امیدواریم که این کار، پژوهشهای بیشتر در حوزه پردازش زبان کردی را موجب شود. کلمات کلیدی: زبان کردی، بازیابی اطلاعات، پردازش زبان طبیعی، ریشهیابی، هستهیابی، غلطگیری
Kurdish is an Indo-European language spoken in a large geographical region spanning the intersections of Iran, Iraq, Turkey, and Syria. Despite having a large number of speakers, Kurdish is among the less-resourced languages and has not seen much attention from the information retrieval (IR) and natural language processing (NLP) research communities. In order to address this resource-scarceness problem, the Kurdish language processing project (KLPP) has been recently launched at University of Kurdistan. KLPP s primary aim is to provide the essential resources and tools for processing Kurdish texts. This report describes the outcomes of a Master s thesis that was carried out in the context of KLPP. The first outcome of this project is the Pewan corpus which contains a large number of documents written in Sorani and Kurmanji, the two main dialects of the Kurdish language. This corpus is a crucial linguistic resource and has been widely used throughout this thesis to facilitate the development of other resources. Building upon this corpus, we construct the Pewan test collection, an evaluation framework for Kurdish IR systems. After providing the necessary prerequisites, we then focus on the specific goals of this thesis which include building a stemmer, a lemmatizer, and a spell-checker for the Kurdish language in general and for the Sorani dialect in particular. To this end, we first build Jedar, a rule-based stemmer (supporting both Sorani and Kurmanji dialects) and show its effectiveness in improving the performance of Kurdish search engines. Next, we develop Peyv, a dictionary-independent lemmatizer which is capable of returning the proper root of any inflected word (verb or noun). Peyv relies on a rich set of morphological rules that we have compiled for the Sorani dialect. Finally, we build Renoos, a spell-checking tool for Sorani texts that leverages statistical as well as rule-based and dictionary-based knowledge. Renoos is able to not only detect the misspelled words, but also suggest a list of potential replacements to the user. We would like to note that all of the proposed solutions in this thesis have been implemented and their effectiveness has been empirically verified thorough experimental studies. Furthermore, all of the linguistic resources and software tools developed throughout this thesis have been made freely-available to the research community. We hope that this will bolster further research on Kurdish language processing. Key Words: Kurdish Language, Information Retrieval, Natural Language Processing, Stemming, Lemmatizing, Spell-Checkingلینک فایل دیجیتالی : https://libapp.uok.ac.ir/faces/search/bibliographic/biblioFullView.jspx?_afPfm=1 [...] لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=15876 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت فاقد شماره ثبت