Sistem De Conversație Bazat Pe Inteligență Artificială - Ajarnpa
Sistem De Conversație Bazat Pe Inteligență Artificială - Ajarnpa
Anonim
Sistem De Conversaie Bazat Pe Inteligență Artificială
Sistem De Conversaie Bazat Pe Inteligență Artificială

Auteur: Stanut Nicolae-Radu

Groep: 333AB

Opmerking: 8

Stap 1: Beschrijf funcională

Descriere Funcțională
Descriere Funcțională

n principiu sistemul va fi asemănător

Asistenților inteligenți pentru casă de tipul Google Assistant și Amazon Alexa, utilizatorii pot da comenzi vocale aparatului, iar acesta va răspunde sau va face of anumită acțiune, n funcție de cerințele utilizatorului. Creierul biedt toegang tot Raspberry pi 3, datorită faptului că dispune de Wi-Fi, acest lucru permițand conectarea la serviciul cloud Amazon, care va da „inteligență” sistemului.

Diensten van de cloud met kunstmatige intelligentie van de Amazone, die kunnen worden gekenmerkt door een functionele en praktische identificatie met Amazon Alexa. De voorbeeldige asistent virtuele poate prezenta starea meteo, poate ține minte notițe, poate pune alarme, dar din păcate(sau fericire?), aceste lucruri depind in totalitate de Amazon, iar comenzile dispozitivului se dau n.

Ca și obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată nțelege și comenzi și de la persoane necunoscătoare de limba engleză. Een ander secundair middel van een asistentie van een automatische verwerking van een proces, een voorbeeld van een stingerea unor lumini, een oprirea unei prijs. Desigur, doar dacă API-ul Amazon va permite aceste lucruri.

Sursa poză:

Stap 2: Componenten

Het volgende is een proiectului die een nieuw resultaat heeft opgeleverd:

  1. Framboos PI 3 B+

    De beste mini-computer is ontworpen voor het maken van een nieuwe versie van Linux Debian voor een processor ARM. De asemenea, acest model dispune și de wi-fi, conexiunea la internet fiind absoluut necesară pentru motoarele de text-în-vorbire i vorbire-în-text

  2. PS Oogcamera

    Pe post microfon ("urechea proiectului") ben ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită

  3. Doos (draagbaar)

    Pentru a transmittere informația către utilizator a fost nevoie de un difuzor, am folosit o boxă cu fir primită de la un prieten

  4. 2 vuur + LED
  5. Caserolă

    Carcasa proiectului, of caserolă de sarmale:D

Stap 3: Hardware

Hardware
Hardware

După ce am adunat componentele, am trecut la implementare, schema este una foarte simplă. Boxa portabil se conectează la portul USB pentru alimentare și la portul jack pentru playback, camera/microfoon se conectează doar la portul USB prin care comunică cu computer-ul. Ben meer in het schema van de led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimische complicatie.

Stap 4: Software

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator(voce), să transforme dateele într-un format accesibil lui(text) i să le redea răspunsul sau confirmarea unei acțivoce înapoi. Pentru acestea a fost nevoie de 3 servicii apart:

  1. Un motor Speech-to-Text (STT), pentru a prelua datele de intrare(informațiile transmise de utilizator prin vorbire)
  2. Un sistem de inteligență artificială, pentru a lua decizii și a rezolva probleme
  3. Un motor Text-to-Speech (TTS), pentru a transmittere utilizatorului răspunsurile sau Confirmările acțiunilor

Pentru STT ben folosit API-ul de la Google, denumit Google Speech API, zorg este gratuit, oferă o calitate mare a conversiei i o rată mică de erori, dar biedt și un număr limitat de apeluri. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de processare, spațiu de stocare, memorie), folosirea unui serviciu offline est exclusă, așa că am optat pentru un serviciu Cloud, oferind și o precizie mai mare, dar și timps de mai Google avand unul dintre cele mai bune motoare STT.

Pentrue feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare consumator de resurse i nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System, zorg este gratuit gratuit sub o liceță de tipul MIT. Vocea este un ușor robotică, dar mult mait mai inteligibilă față de eSpeak, alt motor TTS offline. Het is mogelijk om online diensten te verlenen die u kunt gebruiken om de grenzen van het aantal coversii te beperken.

Liantul dintre STT și TTS, precum și partea "iteligentă" este platforma denumită Jasper. O platform: Open Source, beschikbaar op GitHub via link: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus i ia decizii n funcție de input-ul utilizatorului. Geschikt voor Raspberry PI, zoek naar Python. Er is een goede oplossing voor een nadelige invloed op Cloud dat modulair is, een platform dat toelaat om de programma's van Python te gebruiken.

Sistemul de inteligen artificalăeste unul procedurele, am optat pentru această n detrimentul sistemelor de tip Machine Learning (chatbot) din cauză că cele din urmă au un caracter nedeterminist. Natura platformei Jasper, zoek naar mogelijkheden voor een predefinite, beperkte capaciteit voor convorbire, een mogelijkheid tot cadru potrivit pentru un asistent digital, acesta fiind și scopul proiectului.

Stap 5: Implementeren

  1. Ben instalat sistemul de operare Raspbian pe cardul microSD
  2. Ben conectat camera și difuzorul la Raspberry
  3. Am configurat sistemul de operare, după care am instalat toate bibliotecile și serviciile necesare, urmând toți pașii din acest ghid:
  4. Ben creat și instalat module adiționale pentru a extinde funcționalitatea sistemului

Stap 6: Gebruiken

Image
Image
Gebruiken
Gebruiken
Gebruiken
Gebruiken

Din lipsa unui monitor am configurat dispozitivul să se conecteze la o rețea wireless predefinită, controlul dispozitivului realizându-se prin SSH. Jasper permite două tipuri de interacțiune:

  1. Prin terminal(tekst) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jaspis

Din simplitate voi începe demonstrarea funcționalității prin intermediul terminalului. La rularea comenzii jasper_cli va fi afi at un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Printcomnzile cunoscute se numără:

  • DEFINE + cuvânt - ntoarce definiția din dicționar a cuvântului respectiv
  • WIE, WAT, HOEVEEL, HOEVEEL, HOE OUD + cuvânt - folosește API-ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API-ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • GRAP - spune o glumă
  • LUMOS/NOX - aprinde/stinge LED-ul atașat
  • TRIVIA
  • FILMS - informații despre filme (imdb)
  • NIEUWS - citește știri

In modul voce, deschis la introducee comenzii "jaspis" in linia de comandă, dispozitivul se pune in modul de așteptare, acesta fiind trezit la auzirea unui cuvant-cheie. In cazul de față cuvatul cheie este "Jaspis". U kunt een auzit cuvântul cheie, acesta int n modul de ascultare, putând să primească comenzi exact ca și n modul text. Dup executarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.