Працівники українського стартапу Respeecher розповіли, як відбувається процес запису кримськотатарської мови для штучного інтелекту.
Читайте цей матеріал кримськотатарською
Про це дізналися кореспонденти Суспільного Крим, які відвідали студію звукозапису Respeecher у Києві.
У студії роблять записи для людей, які прийшли це зробити у гарних умовах. Кабель від мікрофона йде на рекордер, який зберігає у цифровому вигляді цей файл. Після цього фахівці прослуховують і відбирають записи.
"Далі ми готуємо дані для тренування і власне запускаємо його. Скажімо так, це можна порівняти з тим, як дитина, коли народжується, вона чує дуже багато мови і в певний момент вона розуміє собі як її повторювати", - зазначив працівник Respeecher Павло Зеленов.
Один з учасників проєкту Ахтем Амзаєв, який вже не вперше приходить на запис свого голосу, розповів, що зацікавився проєктом, адже це допоможе популяризувати його рідну мову.
"Я є по національності кримським татарином. Я народився в Криму, виріс там. Жив у кримськотатарській родині. В нас так було заведено, що в родині, звісно, спілкувались кримськотатарською мовою... Більше і більше носіїв мають до цього доєднуватися, більше аудіо має записуватися, більше інформації надаватися, щоб швидше ми користувалися плодами цього проєкту", - наголосив він.
Що відомо про український стартап Respeecher
Співзасновник проєкту Дмитро Бєлєвцов розповів Суспільному Крим, що Respeecher зараз своєю кампанією по збору 1000 годин кримськотатарською мовою намагається досягнути зазначеної мети - популяризувати та зберегти цю мову.
"Зібрати потрібну кількість даних для того, щоб на ній далі можна було будувати безліч різних речей, які потрібні для поширення кримськотатарської мови, якщо ми хочемо побачити підтримку кримськотатарської мови в багатьох продуктах, в різних голосових асистентах, в іграх, дескорді, в різних чат-ботах, в подібних всяких штуках", - розповів він.
За понад пів року вдалось зібрати близько 70 годин матеріалів. Цього для початку тренування штучного інтелекту замало, зазначають організатори. Вони закликають носіїв мови долучатись до проєкту.
Долучитися до проєкту можна в соціальних мережах на сторінках Respeecher, де можна домовитись про запис в студії чи зробити його вдома у тихій кімнаті. Запис повинен тривати щонайменше пів години.
У травні Дмитро Бєлєвцов розповів Суспільному Крим про свій стартап, який тренує штучний інтелект для розпізнавання кримськотатарської мови, а також як цей проєкт допоможе популяризувати її. Команда сподівається, що потрібний запас аудіо назбирається за пів року.
Підписуйтеся на новини Суспільне Крим у Telegram, Viber та у Facebook