Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Steps
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Steps
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

Forfatter: Stanut Nicolae-Radu

Grupa: 333AB

Merk: 8

Trinn 1: Beskrivelse av funksjonen

Beskrivelse av funksjonen
Beskrivelse av funksjonen

Principn principiu sistemul va fi asemănător

asistenților inteligenți pentru casă de tipul Google Assistant and Amazon Alexa, utilizatorii pot da comenzi vocale aparatului, iar acesta and răspunde sau va face of anumită acțiune, in funcție de cerințele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datamaskin faptului can dispune the Wi-Fi, acest lucru permițând conectarea la serviciul cloud Amazon, care va da "inteligență" system.

Folosind -tjenesten for skyen og den kunstige Amazonas -funksjonen er tilgjengelig for funksjonelle og praktiske identifikasjoner for Amazon Alexa. De eksemplu acest asistent virtual poate prezenta starea meteo, poate minine minte notițe, poate pune alarme, dar din păcate (sau fericire?), Aceste lucruri depind in totalitate de Amazon, iar comenzile dispozitivului se dau in limba engleză.

Ca și obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată înțelege și comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor procese, de exemplu aprinderea și stingerea unor lumini, oprirea unei Prize. Beskrivelse, åpner dacă API-ul Amazon kan tillate acuces lucruri.

Sursa poză:

Trinn 2: Komponent

Pentru realizarea proiectului am avut nevoie de următoarele componente:

  1. Bringebær PI 3 B+

    Acest mini computer este creierul proiectului, rulează o verisune modificată of Linux Debian for un processor ARM. Dette er den beste modellen for Wi-Fi, internettilkobling og absolutt ikke nødvendig for en tekst-în-vorbire vori vorbire-în-tekst

  2. PS øyekamera

    Pe post microfon ("urechea proiectului") er også tilgjengelig på en stasjonær konsoll for Play Station 3, som kan sendes ut av en mikrofon med 4 kanaler, og kan derfor ikke vises på webområdet

  3. Boxă portabilă

    Send en informasjonsinformasjon for brukeren for en ny oppgave

  4. 2 brann + LED
  5. Caserolă

    Carcasa proiectului, o caserolă de sarmale: D

Trinn 3: Maskinvare

Maskinvare
Maskinvare

După ce am adunat componentele, am trecut la implementare, schema este una forte simpleă. Boxing portableă for portul USB port for alimentare and portul jack pentru playback, camera/microfonul se conectează doors the portul USB prin care comunică for computer-ul. Am mai adăugat în schemă și led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimic komplisert.

Trinn 4: Programvare

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce), and transforme datele într-un format accesibil lui (text) si să le redea răspunsul sau confirmmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii separate:

  1. Un motor Speech-to-Text (STT), for a prelua datele de intrare (informațiile transmise de utilizator prin vorbire)
  2. Un sistem de inteligență artificială, pentru a lua decizii și and rezolva problems
  3. Un motor Text-to-Speech (TTS), kan brukes til å overføre en oversikt over en bekreftende handling

Vi kan bruke STT som et API for Google, for Google Speech API, for å gi deg gratis tilgang til en konversasjon eller en mikrofon for erori, og det er en rekke begrensninger. Am ales acest API datamită faptului că această parte and sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de processare, spațiu de stocare, memorie), folosirea unui serviciu offline este exclusă, așa că am optat pentru un serviciu Cloud, oferind și o precizie mai mare, dar și un timp de răspuns mai bun, Google kan også bruke denne motoren til STT.

Tilbakemeldinger-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este forte mare consumator de resurse și nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System, care este oferit gratuit sub o liceță de tipul MIT. Vocea este una ușor robotic, for multi mai inteligibilă față de eSpeak, alt motor TTS offline. Avantajul său față de serviciile online este că nu are niciun fel de limitare la numărul de coversii.

Liantul dintre STT og TTS, precum și partea "iteligentă" este platforma denumită Jasper. Åpen plattform, åpen kildekode, tilgjengelig for GitHub for link-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii in funcție de input-ul utilizatorului. Este compatibilă cu Raspberry PI, find scrisă in Python. Am ales această soluție in detrimentul celor Cloud datamită modularității, platforma permite folosirea oricărui serviciu STT și TTS, dar și definirea oricărei acțiuni folosind limbajul de programare Python.

Systemet for kunstig kunstverk er en prosessuell, men jeg kan velge en variant av maskinlæring (chatbot) som kan brukes til å bestemme en karakter. Natura platformei Jasper, som kan kombineres med forhåndsdefinert, begrenset kapasitet for konvertering, eller tilbyr et unikt digitaliseringsprogram, som kan hjelpe deg med å skaffe et omfattende prosjekt.

Trinn 5: Implementere

  1. Jeg installerer et operativsystem for Raspbian for microSD -kort
  2. Jeg har et kamera med bringebær
  3. Jeg kan konfigurere et system for operasjon, og jeg kan installere bibliotecile og tjenestene som er nødvendige, for å få mer informasjon om dette:
  4. Oppretter jeg en installasjonsmodul som kan brukes til å utvide funksjonaliteten

Trinn 6: Utnytt

Image
Image
Utnyttelse
Utnyttelse
Utnyttelse
Utnyttelse

Din skjerm kan konfigureres for å konfigurere trådløse forhåndsdefinisjoner, styre og utføre realisering av SSH. Jasper tillater interaktive opplysninger:

  1. Prin terminal (tekst) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

Din forenkle voi începe demonstrarea funcționalității prin intermediul terminalului. La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Komprimert cunoscute se numără:

  • DEFINE + cuvânt - întoarce definiția din dicționar a cuvântului respectiv
  • HVEM, HVA, HVOR MYE, HVOR MANGE, HVORDAN GAMLE + cuvânt - folosește API -ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API -ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • JOKE - spune o glumă
  • LUMOS/NOX - aprinde/stinge LED -ul atașat
  • TRIVIA
  • FILMER - informații despre film (IMDB)
  • NYHETER - citește știri

Moduln modul voce, deschis la introducere comenzii "jasper" i linia de comandă, dispozitivul se pune in modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. În cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul a auzit cuvântul cheie, acesta intră in modul de ascultare, putând andă primească comenzi eksakt ca și în modul tekst. După executarea comenzii, dispozitivul intră din nou in așteptare până la o nouă trezire a sa.

Anbefalt: