Inhoudsopgave:
- Stap 1: Beschrijf funcională
- Stap 2: Componenten
- Stap 3: Hardware
- Stap 4: Software
- Stap 5: Implementeren
- Stap 6: Gebruiken
Video: Sistem De Conversație Bazat Pe Inteligență Artificială - Ajarnpa
2024 Auteur: John Day | [email protected]. Laatst gewijzigd: 2024-01-30 11:18
Auteur: Stanut Nicolae-Radu
Groep: 333AB
Opmerking: 8
Stap 1: Beschrijf funcională
n principiu sistemul va fi asemănător
Asistenților inteligenți pentru casă de tipul Google Assistant și Amazon Alexa, utilizatorii pot da comenzi vocale aparatului, iar acesta va răspunde sau va face of anumită acțiune, n funcție de cerințele utilizatorului. Creierul biedt toegang tot Raspberry pi 3, datorită faptului că dispune de Wi-Fi, acest lucru permițand conectarea la serviciul cloud Amazon, care va da „inteligență” sistemului.
Diensten van de cloud met kunstmatige intelligentie van de Amazone, die kunnen worden gekenmerkt door een functionele en praktische identificatie met Amazon Alexa. De voorbeeldige asistent virtuele poate prezenta starea meteo, poate ține minte notițe, poate pune alarme, dar din păcate(sau fericire?), aceste lucruri depind in totalitate de Amazon, iar comenzile dispozitivului se dau n.
Ca și obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată nțelege și comenzi și de la persoane necunoscătoare de limba engleză. Een ander secundair middel van een asistentie van een automatische verwerking van een proces, een voorbeeld van een stingerea unor lumini, een oprirea unei prijs. Desigur, doar dacă API-ul Amazon va permite aceste lucruri.
Sursa poză:
Stap 2: Componenten
Het volgende is een proiectului die een nieuw resultaat heeft opgeleverd:
-
Framboos PI 3 B+
De beste mini-computer is ontworpen voor het maken van een nieuwe versie van Linux Debian voor een processor ARM. De asemenea, acest model dispune și de wi-fi, conexiunea la internet fiind absoluut necesară pentru motoarele de text-în-vorbire i vorbire-în-text
- PS Oogcamera
Pe post microfon ("urechea proiectului") ben ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită
-
Doos (draagbaar)
Pentru a transmittere informația către utilizator a fost nevoie de un difuzor, am folosit o boxă cu fir primită de la un prieten
- 2 vuur + LED
-
Caserolă
Carcasa proiectului, of caserolă de sarmale:D
Stap 3: Hardware
După ce am adunat componentele, am trecut la implementare, schema este una foarte simplă. Boxa portabil se conectează la portul USB pentru alimentare și la portul jack pentru playback, camera/microfoon se conectează doar la portul USB prin care comunică cu computer-ul. Ben meer in het schema van de led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimische complicatie.
Stap 4: Software
Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator(voce), să transforme dateele într-un format accesibil lui(text) i să le redea răspunsul sau confirmarea unei acțivoce înapoi. Pentru acestea a fost nevoie de 3 servicii apart:
- Un motor Speech-to-Text (STT), pentru a prelua datele de intrare(informațiile transmise de utilizator prin vorbire)
- Un sistem de inteligență artificială, pentru a lua decizii și a rezolva probleme
- Un motor Text-to-Speech (TTS), pentru a transmittere utilizatorului răspunsurile sau Confirmările acțiunilor
Pentru STT ben folosit API-ul de la Google, denumit Google Speech API, zorg este gratuit, oferă o calitate mare a conversiei i o rată mică de erori, dar biedt și un număr limitat de apeluri. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de processare, spațiu de stocare, memorie), folosirea unui serviciu offline est exclusă, așa că am optat pentru un serviciu Cloud, oferind și o precizie mai mare, dar și timps de mai Google avand unul dintre cele mai bune motoare STT.
Pentrue feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare consumator de resurse i nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System, zorg este gratuit gratuit sub o liceță de tipul MIT. Vocea este un ușor robotică, dar mult mait mai inteligibilă față de eSpeak, alt motor TTS offline. Het is mogelijk om online diensten te verlenen die u kunt gebruiken om de grenzen van het aantal coversii te beperken.
Liantul dintre STT și TTS, precum și partea "iteligentă" este platforma denumită Jasper. O platform: Open Source, beschikbaar op GitHub via link: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus i ia decizii n funcție de input-ul utilizatorului. Geschikt voor Raspberry PI, zoek naar Python. Er is een goede oplossing voor een nadelige invloed op Cloud dat modulair is, een platform dat toelaat om de programma's van Python te gebruiken.
Sistemul de inteligen artificalăeste unul procedurele, am optat pentru această n detrimentul sistemelor de tip Machine Learning (chatbot) din cauză că cele din urmă au un caracter nedeterminist. Natura platformei Jasper, zoek naar mogelijkheden voor een predefinite, beperkte capaciteit voor convorbire, een mogelijkheid tot cadru potrivit pentru un asistent digital, acesta fiind și scopul proiectului.
Stap 5: Implementeren
- Ben instalat sistemul de operare Raspbian pe cardul microSD
- Ben conectat camera și difuzorul la Raspberry
- Am configurat sistemul de operare, după care am instalat toate bibliotecile și serviciile necesare, urmând toți pașii din acest ghid:
- Ben creat și instalat module adiționale pentru a extinde funcționalitatea sistemului
Stap 6: Gebruiken
Din lipsa unui monitor am configurat dispozitivul să se conecteze la o rețea wireless predefinită, controlul dispozitivului realizându-se prin SSH. Jasper permite două tipuri de interacțiune:
- Prin terminal(tekst) - la rularea comenzii jasper_cli
- Prin voce - la rularea comenzii jaspis
Din simplitate voi începe demonstrarea funcționalității prin intermediul terminalului. La rularea comenzii jasper_cli va fi afi at un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Printcomnzile cunoscute se numără:
- DEFINE + cuvânt - ntoarce definiția din dicționar a cuvântului respectiv
- WIE, WAT, HOEVEEL, HOEVEEL, HOE OUD + cuvânt - folosește API-ul wolframalpha pentru a răspunde la întrebări generale
- WIKI - folosește API-ul de la wikipedia pentru a oferi informații despre diferite noțiuni
- GRAP - spune o glumă
- LUMOS/NOX - aprinde/stinge LED-ul atașat
- TRIVIA
- FILMS - informații despre filme (imdb)
- NIEUWS - citește știri
In modul voce, deschis la introducee comenzii "jaspis" in linia de comandă, dispozitivul se pune in modul de așteptare, acesta fiind trezit la auzirea unui cuvant-cheie. In cazul de față cuvatul cheie este "Jaspis". U kunt een auzit cuvântul cheie, acesta int n modul de ascultare, putând să primească comenzi exact ca și n modul text. Dup executarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.