Innholdsfortegnelse:
- Trinn 1: Sett opp en Google Cloud Storage Bucket
- Trinn 2: Formater dataene dine og opprett datasett -csv
- Trinn 3: Last opp spektrogrammene dine til din bøtte
- Trinn 4: Last opp datasettet Csv
- Trinn 5: Lag datasett
- Trinn 6: Lag din AutoML -modell
- Trinn 7: Test modellen din
- Trinn 8: Installer modellen din i ThinkBioT
Video: Del 2. ThinkBioT -modell med Google AutoML: 8 trinn
2025 Forfatter: John Day | [email protected]. Sist endret: 2025-01-13 06:58
ThinkBioT er designet for å være "Plug and Play", med Edge TPU -kompatible TensorFlow Lite -modeller.
I denne dokumentasjonen dekker vi opprettelse av spektrogrammer, formatering av dataene dine og bruk av Google AutoML.
Koden i denne opplæringen vil bli skrevet i bash, så den vil være kompatibel på flere plattformer.
Avhengigheter
- Men før du begynner må du installere Sox et kommandolinjelydprogram som er kompatibelt med Windows, Mac og Linux -enheter.
- Hvis du er på en Windows -enhet, er den enkleste måten å kjøre bash -skript på via Git, så jeg vil anbefale og laste ned og installere det som nyttig på mange måter,
- For å redigere kode, bruk enten favorittredigereren eller installer NotePad ++ for Windows eller Atom for andre operativsystemer.
** Hvis du har en eksisterende TensorFlow -modell eller ønsker å prøve å overføre læring med en eksisterende modell, kan du se i Google Coral Documentation.
Trinn 1: Sett opp en Google Cloud Storage Bucket
1. Logg på gmail -kontoen din (eller opprett en hvis du ikke har en Google -konto)
2. Gå til siden for prosjektvelger og lag et nytt prosjekt for modell- og spektrogramfiler. Du må aktivere fakturering for å gå videre.
3. Besøk https://cloud.google.com/storage/ og trykk på opprett bøtte -knappen øverst på siden.
4. Skriv inn ønsket bøttenavn og opprett bøtte som godtar standardinnstillinger.
Trinn 2: Formater dataene dine og opprett datasett -csv
Jeg har designet et nyttig skript for å lage datasettet.csv -filen som trengs for å lage modellen din. Datasettfilen knytter bildene i bøtte til etikettene i datasettet.
1. Last ned ThinkBioT -depotet fra GitHub og
2. Kopier filen tbt_spect_example.sh fra Verktøy -katalogen til en ny mappe på skrivebordet.
3. Legg til lydfilene du vil bruke i modellen din, og legg dem i mapper som har etiketten (dvs. hva du vil at de skal sorteres i. Hvis du for eksempel vil identifisere hunder eller katter, kan du ha en mappe hund, med barklyder ELLER mappe som heter katt med kattelyder osv.
4. Åpne tbt_spect_example.sh med Notisblokk ++ og erstatt "ditt boknavn" på linje 54 med navnet på Google Storage Bucket. For eksempel, hvis bøtten din ble kalt myModelBucket, ville linjen blitt endret til
bucket = "gs: // myModelBucket/spectro-data/"
5. Kjør koden ved å skrive følgende i Bash-terminalen, koden vil kjøre og lage etikettene csv-filen og en katalog som kalles spektrodata på skrivebordet med de resulterende spektrogrammene.
sh tbt_spect_example.sh
Trinn 3: Last opp spektrogrammene dine til din bøtte
Det er noen få måter å laste opp til Google Storage på. Det enkleste er å laste opp en direkte mappe;
1. Klikk på bøtte -navnet ditt på Google Storage -siden.
2. Velg "UPLOAD FOLDER" -knappen og velg "spectro-data/" -katalogen som ble opprettet i det siste trinnet.
ELLER
2. Hvis du har en stor mengde filer, kan du manuelt opprette "spectro-data/" -katalogen ved å velge "CREATE FOLDER", deretter navigere du inn i mappen og velge "UPLOAD FILES". Dette kan være et flott alternativ for store datasett, ettersom du kan laste opp spektrogrammene i seksjoner, til og med ved å bruke flere datamaskiner for å øke opplastingshastigheten.
ELLER
2. Hvis du er en avansert bruker, kan du også laste opp via Google Cloud Shell;
gsutil cp spectro-data/* gs: // your-bucket-name/spectro-data/
Du bør nå ha en bøtte full av ganske vakre spektrogrammer!
Trinn 4: Last opp datasettet Csv
Nå må vi laste opp modell-labels.csv-filen til "spectro-data/" -katalogen i Google Storage, den er i hovedsak det samme som det siste trinnet, du laster bare opp en enkelt fil i stedet for mange.
1. Klikk på bøtte -navnet ditt på Google Storage -siden.
2. Velg "OPPLAD FIL" -knappen og velg modell-labels.csv-filen du opprettet tidligere.
Trinn 5: Lag datasett
1. For det første må du finne AutoML VIsion API, det kan være litt vanskelig! Den enkleste måten er å søke etter "automl vision" i søkefeltet i Google Cloud -lagringen din (bildet).
2. Når du klikker på API -lenken må du aktivere API -en.
3. Nå vil du være i AutoML Vision Dashboard (bildet) klikke på den nye datasettknappen og velge Single label og alternativet 'Select a CSV file'. Du vil deretter inkludere lenken til din model-labels.csv-fil i oppbevaringsbøtten. Hvis du har fulgt denne opplæringen, vil den være som beskrevet nedenfor
gs: //yourBucketName/spectro-data/model-labelsBal.csv
4. Trykk deretter på Fortsett for å lage datasettet. Det kan ta litt tid å lage.
Trinn 6: Lag din AutoML -modell
Når du har mottatt e -posten din for å vite at datasettet ditt er opprettet, er du klar til å lage din nye modell.
- Trykk på TRAIN -knappen
- Velg modelltype: Estimater for kant- og modellforsinkelse: Kant -TPU, og la de andre alternativene stå som standard i utgangspunktet, vanskelig du kanskje vil eksperimentere med og senere.
- Nå vil modellen din trene, det vil ta litt tid, og du vil motta en e -post når den er klar til nedlasting.
Merk: Hvis du trener -knappen er utilgjengelig, kan du ha problemer med datasettet ditt. Hvis du har mindre enn 10 av hver klasse (etikett), lar systemet deg ikke trene en modell, så du må kanskje legge til ekstra bilder. Det er verdt å ta en titt på Google AutoML -videoen hvis du trenger avklaring.
Trinn 7: Test modellen din
Når du har mottatt modellen for ferdigstillelse av modellen, klikker du på lenken for å gå tilbake til AutoML Vision API.
1. Nå vil du kunne se resultatene og forvirringsmatrisen for modellen din.
2. Det neste trinnet er å teste modellen din, gå til 'TEST & BRUK' eller 'FORutsig' merkelig det ser ut til å være to bruker -GUI -er, som jeg begge har avbildet, men alternativene begge har samme funksjonalitet.
3. Nå kan du laste opp et testspektrogram. For å lage et enkelt spektrogram kan du bruke programmet tbt_make_one_spect.sh fra ThinkBioT Github. Bare slipp den i en mappe med wav som du vil konvertere til et spektrogram, åpne et Git Bash -vindu (eller terminal) og bruk koden nedenfor, og erstatt filnavnet ditt.
sh tbt_make_one_spect.sh yourWavName.wav
4. Bare last opp spektrogrammet og sjekk resultatet!
Trinn 8: Installer modellen din i ThinkBioT
For å bruke din nye skinnende modell slipper du bare modellen og txt -filen i CModel -mappen;
pi> ThinkBioT> ClassProcess> CModel
Nå er du klar til å bruke ThinkBioT:)
** NB ** Hvis du bruker modellen din utenfor ThinkBioT-rammeverket, må du redigere etikettdokumentet som et tillegg til begynnelsen av hver linje, ettersom de siste tflite-tolkerne innebygde "readlabels" -funksjonen antar at de er der. Jeg har skrevet en egendefinert funksjon i ThinkBioT -rammen classify_spect.py som et arbeid du kan bruke i din egen kode:)
def ReadLabelFile (file_path):
teller = 0 med åpen (file_path, 'r', encoding = 'utf-8') som f: lines = f.readlines () ret = {} for linje i linjer: ret [int (counter)] = line.strip () teller = teller + 1 returret