IT აკადემია STEP! ჩვენ 1999 წლიდან ვსწავლობთ. მაღალი ხარისხის კომპიუტერულ განათლებას მოზრდილებში და ბავშვებში.

Your browser is out of date!

You are using an outdated browser Internet Explorer. This version of the browser does not support many modern technologies, that's why many pages of the website are not displayed correctly, and may not work some of functions . We recommend viewing the website using the latest versions of the browsers Google Chrome, Safari, Mozilla Firefox, Opera, Microsoft Edge

ШАГ логотип

Siri-ს ხმის განვითარება რობოტიდან ადამიანამდე

14.03.2020

357 დათვალიერება

ხელოვნური ინტელექტის სიღრმისეული სწავლება აძლიერებს ჩვენს ეფექტურობას და უფრო მეტად გამოიყენებადს ხდის ვირტუალურ-პერსონალურ ასისტენტებს. შეიტყვეთ, თუ როგორ გამოიყენეს ისინი სირის ხმის გასაუმჯობესებლად.

თუ IOS- ის მომხმარებელი ხართ, დღეში რამდენჯერ ლაპარაკობთ Siri-თან? შეამჩნევდით, რომ Siri- ს ხმა ბევრად უფრო ჰგავს ადამიანის ხმას iOS 11-ში, ვიდრე ეს აქამდე იყო.რაც ხდება იმის გამო, რომ Apple-ი დეტალურად იკვლევს ხელოვნურ ინტელექტს, მანქანათმცოდნეობას და სიღრმისეული სწავლის ტექნოლოგიას, იმისთვის, რომ საუკეთესო პირადი ასისტენტის გამოცდილება შესთავაზოს მის მომხმარებლებს.

Siri– ს დანერგვიდან iPhone 4S–თან ერთად და iOS 11 – ში მისი გაგრძელებადან, აღნიშნული პერსონალური თანაშემწე განვითარდა ადამიანებთან დაახლოების და მათთან კარგი ურთიერთობების დამყარების მიზნით. მომხმარებლების ხმოვან ბრძანებებზე პასუხის გასაცემად, Siri იყენებს მეტყველების სინთეზს სიღრმისეულ სწავლებასთან ერთად.

მეტყველების სინთეზი: სირის ფუნქციონირების ინტეგრალური ნაწილი

მეტყველების სინთეზი, ძირითადად, ადამიანის მეტყველების ხელოვნურ წარმოებას წარმოადგენს. ეს ტექნოლოგია ძირითადია რამდენიმე დომენში, მათ შორის ვირტუალურ პერსონალურ თანაშემწეებში, თამაშებსა და გასართობებში. მიუხედავად იმისა, რომ   ერთეულის შერჩევის და პარამეტრული სინთეზის ძირითად მოდელებში გარკვეულ წარმატებას მიაღწიეს, სიღრმისეულმა სწავლებამ მასში უფრო ღრმად შეაღწია.

ამ ტექნოლოგიის ინტეგრაციამ მეტყველების სინთეზში განაპირობა ახალი მოდელის აღმავლობა, რომელიც ცნობილია როგორც პირდაპირი ტალღის მოდელირება. ამ მოდელის საშუალებით უკვე შესაძლებელია მაღალხარისხიანი ერთეულის შერჩევის სინთეზის დამუშავება და აგრეთვე პარამეტრული სინთეზით მოქნილობის უპირატესობის მიღწევა.

Apple იყენებს სიღრმისეული სწავლების ძალას ჰიბრიდული ერთეულის შერჩევის სისტემებში, რათა მიიღონ ყველაზე მაღალი ხარისხის ხმოვანი გამომავალი Siri.

როგორ მუშაობს ტექსტური-მეტყველების სისტემა (TTS)

TTS სისტემა მუშაობს ადამიანის ხმების ჩაწერის გამოყენებით შესაძლო შემთხვევებისთვის, მეტყველების განყოფილებების გამრავლების და მანქანების სწავლის გამოყენებით.

ადამიანის ხმების ჩაწერა შესაძლო შემთხვევებისთვის

ვირტუალური პირადი თანაშემწეებისთვის ტექსტური – მეტყველების სისტემის შექმნის პირველი მთავარი ამოცანაა ადამიანის ხმის ჩაწერა. ეს ხმა არამარტო სასიამოვნო მოსასმენი უნდა იყოს, არამედ ყველასთვის გასაგებიც უნდა იყოს.

ადამიანის მეტყველების მრავალფეროვნების ასათვისებლად, საჭიროა პროფესიონალურ სტუდიაში ჩაწეროთ დაახლოებით 20 საათის მეტყველება. ეს მოიცავს თითქმის ყველა ტიპის პასუხს, მათ შორის ინსტრუქციების თხრობას, ამინდის მოხსენებების კარნახს, ხუმრობის თქმას და ა.შ. შეუძლებელია ამ აუდიო კლიპების გამოყენება არსებული სახით, რადგან შეზღუდვები არ არსებობს კითხვების ტიპებზე, რომლებიც ნებისმიერმა მომხმარებელმა შეუძლია ჰკითხოს პერსონალურ ასისტენტს. აღნიშნული ჩაწერილი პასუხების დამუშავება ხდება იმისთვის, რომ ვირტუალურმა ასისტენტმა ისწავლოს მათ შესახებ ინფორმაცია.

მეტყველების ერთეულების გაორება

ადამიანის ჩაწერილი მეტყველება რამდენიმე კომპონენტად არის დაყოფილი და მოგვიანებით ერთდება მიღებული ტექსტის მიხედვით, სრულყოფილი პასუხის შესაქმნელად. სპეციფიკური მოწყობილობებისთვის მეტყველების კომპონენტების ოპტიმიზაცია ან მოწყობილობების ნებისმიერი მასივისთვის მათი თავსებადობა მოითხოვს თითოეული ტელეფონის აკუსტიკური მახასიათებლების ანალიზსა და მეტყველების პროსოდიის ანალიზს.

მანქანათმცოდნეობის გამოყენება

დეველოპერებისთვის საკმაოდ ძნელად მისაღწევია, რომ მიიღონ სტრესის და ინტონაციის სრულყოფილი მოდელი (პროსოდი). გარდა ამისა, მობილური ტელეფონისთვის მძიმე იქნება ამ მეთოდით მუშაობა.

ეს გამოწვევები გარკვეულწილად მოგვარდა მანქანათმცოდნეობის დანერგვით. ტრენინგისთვის მონაცემების შეგროვებით შესაძლებელია ტექსტური-მეტყველების სისტემამ გაიგოს ნიმუში და როგორ გაყოს აუდიოს სხვადასხვა ელემენტები ადამიანის ბუნებრივი ხმის გამომუშავების მისაღებად.

Apple- ის ძალისხმევა Siri-ის ხმის გაუმჯობესებისთვის

მას შემდეგ, რაც მათ გადაწყვიტეს სრულყოფილად ემუშავათ სირის ხმის გასაუმჯობესებლად, Apple– ის ინჟინრებმა იმუშავეს ქალის ხმის მქონე მსახიობთან, რომ ჩაეწერათ 20 საათის საუბარი აშშ – ს აქცენტით ინგლისურ ენაზე. ამ 1-2 მილიონიანი აუდიო სეგმენტის ჩანაწერები შემდეგ გამოიყენეს სიღრმისეული სწავლის სისტემის ტრენინგის მიზნით.

შემდეგ, მათ გამოსცადეს გამომავალი შედეგები, რომ საგანი აერჩიათ Siri– ს წინა და ახალი ხმებიდან. მათი უმრავლესობა უპირატესობას ანიჭებდა ახალ ბუნებრივ და ადამიანის მსგავსი სირის ხმას. მათ შენიშნეს აშკარა განსხვავება რობოტსა ბუნებრივ ხმას შორის, როდესაც სირი პასუხობდა წვრილმან კითხვებზე, დაადასტურეს "მოთხოვნა დასრულებულია" შეტყობინებები და უზრუნველყვეს სხვა სანავიგაციო მითითებები.

უფრო მეტიც, სატესტო საგნების მოსაზრება იყო ის, რომ ეს ხმა მშვენივრად შეესაბამებოდა სირის "პიროვნებას". iOS აპლიკაციების განვითარების სერვისების პროვაიდერები სწავლობენ ამ ტექნოლოგიას იმისთვის რომ შეიტყონ, თუ როგორ შეიძლება იგივე მასალის გამოყენება უფრო მეტი ინოვაციური პროგრამების შესაქმნელად.

Apple არასოდეს შეწყვეტს ტექნოლოგიის ექსპერიმენტებს, ახალი შესაძლებლობების აღმოჩენის მიზნით. ახლა, როცა სირის ხმა გაუმჯობესდა, Apple დაკვირვების ეტაპზეა, რომ გაიგოს საბოლოო მომხმარებლების რეაქცია.

ხელოვნური ინტელექტი და სიღრმისეული სწავლება აძლიერებს ვირტუალურ პერსონალურ ასისტენტებში გამოყენების ფესვებს და ვითარდება სხვა პროგრამების გამოყენების თვალსაზრისით. ამ ტექნოლოგიების მომავალი საკმაოდ ნათელი ჩანს, რადგან ადამიანები მასზე დადებითად რეაგირებენ.

IT Academy STEP – მსოფლიო ბრენდი 82 ფილიალით!
გახდი კვალიფიციური სპეციალისტი და საკუთარი საქმის პროფესიონალი, შემოგვიერთდით სტეპერების დიდ ოჯახში 

თბილისი,

საბურთალო, ალ.ყაზბეგის 34/34ბ



ავტორის სწავლების ტექნოლოგიები::

IT აკადემია STEP

გადაწყვეტილების მიღებას ალგორითმები გვასწავლიან? – ტექნოლოგიები, რომლებიც ჩვენს ქცევას მართავენ

ალგორითმები ყოველდღიურად ახდენენ გავლენას ჩვენს გადაწყვეტილებებზე - სოციალური მედიის პოსტეიდან დაწყებული, დასაქმების შესაძლებლობებით დამთავრებული. სტატიაში განხილულია, როგორ მართავენ ტექნოლოგიები ჩვენს ქცევას და რატომაა მნიშვნელოვანი კრიტიკული აზროვნება ციფრულ ეპოქაში, ასევე როგორ შეგვიძლია შევინარჩუნოთ ავტონომია ალგორითმებით მართულ სამყაროში.

ციფრული ალგორითმები და მათი უხილავი ზეგავლენა თანამედროვე ცხოვრება წარმოუდგენელია ციფრული ალგორითმების გარეშე, რომლებიც ყოველდღიურად ზემოქმედებენ ჩვენს გადაწყვეტილებებზე. შესაძლოა ამას ვერც კი ამჩნევთ, მაგრამ როდესაც სოციალურ ქსელებში ათვალიერებთ ახალ ამბებს, ეძებთ ინფორმაციას ან უყურებთ ვიდეოებს, ალგორითმები აქტიურად მართავენ თქვენს ციფრულ გამოცდილებას. ტექნოლ

ШАГ логотип

მოტივაცია

ტექნოლოგიები

ტექნოლოგიური ბუმი: რა უნდა იცოდე, რომ ახალ რეალობაში კონკურენტუნარიანი დარჩე?

თანამედროვე სამყაროში, ტექნოლოგიური ბუმი ფუნდამენტურად ცვლის პროფესიულ ლანდშაფტს, რაც ახალი უნარების შეძენასა და მუდმივ განვითარებას მოითხოვს. სტატია გთავაზობთ გზამკვლევს იმის შესახებ, თუ როგორ შეინარჩუნოთ კონკურენტუნარიანობა ციფრულ ეპოქაში.

ტექნოლოგიურმა ინოვაციებმა ფუნდამენტურად შეცვალა ჩვენი ცხოვრების ყველა ასპექტი. დღეს, როდესაც ხელოვნური ინტელექტი, ბლოკჩეინი, კვანტური კომპიუტერები და სხვა ინოვაციები სწრაფი ტემპით ვითარდება, აუცილებელია ფეხი ავუწყოთ ტექნოლოგიურ პროგრესს, რათა კონკურენტუნარიანები დავრჩეთ შრომის ბაზარზე. ამ სტატიაში გაგიზიარებთ მნიშვნელოვან ინფორმაციას იმის შესახებ, თუ როგორ შეგიძლ

ШАГ логотип

მოტივაცია

პროფესიები, რომლებსაც სკოლაში არ გვასწავლიდნენ – და ახლა ყველაზე მოთხოვნადია

თანამედროვე შრომის ბაზარი სწრაფად იცვლება. დღეს ყველაზე მოთხოვნადი პროფესიების უმეტესობა რამდენიმე ათწლეულის წინ არც კი არსებობდა, ან მხოლოდ ჩანასახის დონეზე იყო. სკოლებში სასწავლო პროგრამები ხშირად ვერ აუბამენ მხარს თანამედროვე ტენდენციებს, რის გამოც ახალგაზრდები კარიერისთვის მოუმზადებლები რჩებიან. განვიხილოთ ის პროფესიები, რომლებიც დღეს ყველაზე მოთხოვნადია, მაგრამ სკოლის მერხიდან ვერ ვისწავლეთ.

თანამედროვე შრომის ბაზარი სწრაფად იცვლება. დღეს ყველაზე მოთხოვნადი პროფესიების უმეტესობა რამდენიმე ათწლეულის წინ არც კი არსებობდა, ან მხოლოდ ჩანასახის დონეზე იყო. სკოლებში სასწავლო პროგრამები ხშირად ვერ აუბამენ მხარს თანამედროვე ტენდენციებს, რის გამოც ახალგაზრდები კარიერისთვის მოუმზადებლები რჩებიან. განვიხილოთ ის პროფესიები, რომლებიც დღეს ყველაზე მოთხოვნადია, მაგრ

ШАГ логотип

ყველაფერი ავტომატიზირდება, სად დარჩება ადამიანი?

თანამედროვე მსოფლიოში ავტომატიზაცია და ხელოვნური ინტელექტი ჩვენი ცხოვრების განუყოფელი ნაწილი გახდა. ყოველდღიურად ვხედავთ, თუ როგორ იკავებს ტექნოლოგია ადამიანის ადგილს სხვადასხვა სფეროში. ეს პროცესი ბევრ კითხვას და შიშს ბადებს საზოგადოებაში: „ხომ არ დავრჩებით უმუშევრად?", „რა ადგილი გვექნება მომავლის სამყაროში?". სტატიაში განვიხილავთ ავტომატიზაციის გავლენას ჩვენს ცხოვრებაზე და იმ სფეროებს, სადაც ადამიანი კვლავაც შეუცვლელი რჩება.

თანამედროვე მსოფლიოში ავტომატიზაცია და ხელოვნური ინტელექტი ჩვენი ცხოვრების განუყოფელი ნაწილი გახდა. ყოველდღიურად ვხედავთ, თუ როგორ იკავებს ტექნოლოგია ადამიანის ადგილს სხვადასხვა სფეროში. ეს პროცესი ბევრ კითხვას და შიშს ბადებს საზოგადოებაში: „ხომ არ დავრჩებით უმუშევრად?", „რა ადგილი გვექნება მომავლის სამყაროში?". სტატიაში განვიხილავთ ავტომატიზაციის გავლენას ჩვენს ცხო

ШАГ логотип

ამ საიტზე გამოიყენება Cookies

Კონფიდენციალურობის პოლიტიკა