Поддержать нас
Беларусы на войне
  1. Известный производитель обуви недавно попал в «реанимацию» — за это время ему стало хуже. Появились новые подробности
  2. Появилось несколько изменений по авторынку — от водительских удостоверений до утильсбора
  3. Лукашенко продолжает высказываться насчет визита Тихановской в Киев. Теперь решил переврать ее фразу
  4. «Кошмар. Нет слов, одни маты». В одном из крупных беларусских городов люди занимают очередь в ГАИ с вечера
  5. В Беларуси ввели лимит задолженности на балансах абонентов сотовой связи
  6. «Возрастных ограничений для работников». Для рынка труда хотят ввести изменения
  7. Для населения вводят новое ограничение — но в этом году были и другие. Вскоре могут появиться еще ужесточения
  8. У одного дома висела «Пагоня», другого уволили за разговор со Статкевичем. Как сложились судьбы руководителей беларусского КГБ
  9. Синоптики сделали предупреждение из-за предстоящей погоды в понедельник — есть смысл ознакомиться с прогнозом
  10. Чиновники придумали очередное ограничение для населения — в чем оно заключается и когда заработает
  11. На «Беларусьфильме» запускают новое кино. Есть повод для оптимизма
  12. В Армении начались парламентские выборы — на фоне давления Москвы и поддержки Запада
  13. «Выбора у „Белавиа“ особого нет». В Минске заметили три необычных самолета: вероятно, они пополнят парк национального авиаперевозчика
  14. Путин прокомментировал адресованное ему письмо Зеленского с предложением встречи
  15. В сборной Беларуси по футболу появился самый возрастной в истории дебютант. Его присутствие помогло одержать третью подряд победу
  16. Вводят новшества по земельным участкам и недвижимости — власти пояснили, что и для кого изменилось
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.