Hotword-detektering med Raspberry Pi och Snowboy: En guide

Artikelns innehåll

Hotword-detektering med Raspberry Pi och Snowboy: En guide
Vad är Snowboy?
Installation av nödvändiga programvaror
Konfiguration av ljudinställningar
Så här tränar du och använder befintliga modeller
Skriva Python-skript för ljuddetektering
Registrera och lagra ljudprover
Alternativa tjänster: Porcupine
Sammanfattning
Vanliga frågor (FAQ)
Resurser och referenser

Hotword-detektering med Raspberry Pi och Snowboy: En guide

I denna guide kommer vi att utforska hur man använder Raspberry Pi för att implementera hotword detektion med hjälp av Snowboy. Oavsett om du är en nybörjare eller en erfaren hobbyist, kommer våra instruktioner att leda dig genom hela processen, från installation till att skriva egna Python-skript. Våra vägledningar är utformade för att göra det enklare för dig att få rätt verktyg på plats för att få din röstaktiverade enhet igång.

Vi kommer att börja med en introduktion till Snowboy och dess funktioner, och fördjupa oss i nödvändig programvara och inställningar för ljud. Du kommer också att lära dig att registrera och spara ljudprover, samt hur du kan skriva skript som interagerar med ljuddetekteringen. Trots att Snowboys tjänst för att träna nya modeller inte längre är tillgänglig, så finns det ändå mycket du kan göra med de befintliga modellerna och vi kommer att diskutera alternativa tjänster som Porcupine. Låt oss dyka in!

Världen av hotword detektion har växt enormt under de senaste åren, och med hjälp av Raspberry Pi och Snowboy kan du också skapa dina egna röstaktiverade system. Genom att använda Raspberry Pi får du en kostnadseffektiv plattform för att experimentera och bygga din egen teknik. Snowboy, som tidigare erbjöd möjligheten att träna en mängd olika hotwords, gör det fortfarande möjligt att använda sina befintliga modeller, vilket ger dig en utmärkt möjlighet att komma igång med ditt projekt.

I denna guide kommer du att lära dig att konfigurera din Raspberry Pi för att använda Snowboy för hotword detektion. Vi kommer att gå igenom installation av nödvändig programvara, ljudinställningar, samt ge instruktioner för att skriva Python-skript. Vår mål är att ge dig en omfattande översikt så att du kan sätta igång så snabbt och smidigt som möjligt.

Vad är Snowboy?

Snowboy är en hotword detekteringstjänst som används för att utveckla röstaktiverade system. Det är en skräddarsydd lösning som gör det möjligt för utvecklare att använda fördefinierade hotwords i sina projekt. Snowboys tjänst stod tidigare tillgänglig för att skapa och träna anpassade röstmodeller, men den har sedan den 1 januari 2021 upphört. Trots detta, så är deras befintliga modeller fortfarande tillgängliga för användning.

Genom att implementera Snowboy i ditt Raspberry Pi projekt kan du interagera med hårdvaran genom röst, vilket skapar en mer engagerande och användarvänlig upplevelse. Med Snowboy kan du skapa projekt som röststyrda lampor, media-controll, eller till och med smarta hem-lösningar.

Installation av nödvändiga programvaror

Innan du kan börja använda hotword detektering med Snowboy, måste du installera vissa verktyg och programvara på din Raspberry Pi. Här är stegen för installation:

Uppdatera ditt system: Börja med att säkerställa att ditt Raspberry Pi system är uppdaterat. Öppna terminalen och kör följande kommandon:

sudo apt-get update
sudo apt-get upgrade

Installera Python och pip: Snowboy kräver Python för att köra. Se till att Python och pip är installerade:

sudo apt-get install python3
sudo apt-get install python3-pip

Installera ytterligare beroenden: Du måste också installera några nödvändiga beroenden för ljudbehandling. Kör följande kommando:

sudo apt-get install python3-dev portaudio19-dev
sudo pip3 install pyaudio
sudo pip3 install numpy

Clone Snowboy-repositoriet: Den senaste versionen av Snowboy kan laddas ner från deras GitHub repo:

git clone https://github.com/Kitt-AI/snowboy.git

Installera Snowboy: Navigera till den nedladdade mappen och installera Snowboy:

cd snowboy
sudo python3 setup.py install

Efter att dessa steg har genomförts är du redo att börja med konfigurationen av ljudinställningarna.

Konfiguration av ljudinställningar

För att Snowboy ska kunna detektera ljud effektivt måste du ställa in och konfigurera ljudinställningarna på din Raspberry Pi. Följ dessa steg för att säkra att allt fungerar korrekt:

Kontrollera ljudinställningar: Använd kommandotalsverktyget alsamixer för att kontrollera och justera ljudinställningarna:

Öppna terminalen och skriv in alsamixer.
Använd piltangenterna för att navigera, se till att din mikrofon är vald och att volymen är hög nog

Testa ljudets fångst: För att säkerställa att din mikrofon fångar ljud, kan du använda kommandot:

arecord -l
arecord -D plughw:1,0 -f cd test.wav
aplay test.wav

Justera ljudoutput: Se till att ljudoutput fungerar som det ska. Det kan krävas att du provspelar något ljud för att verifiera detta.

När alla ljudinställningar har konfigurerats är du redo att träna och använda befintliga modeller för hotword detektering.

Så här tränar du och använder befintliga modeller

Trots att Snowboys träningstjänst inte längre är aktiv, kan du fortfarande använda deras befintliga modeller för hotword detektering. Här är stegen för att börja:

Ladda ner befintliga modeller: Snowboy erbjuder flera modeller för olika hotwords. Du kan ladda ner dem från deras officiella webbplats eller GitHub-repo.
Placerar modellfiler: När du har laddat ner modellerna, placera dem i din Snowboy-mapp.
Anpassa din Python-applikation: Anpassa ditt Python-skript för att använda de specifika modellerna genom att referera till den nedladdade modellens filnamn.
Kör och testa din applikation: Starta ditt Python-skript och testa att detektera hotword när du pratar.

Genom att följa dessa steg kommer du att kunna använda de befintliga modellerna för att skapa och implementera egna röstaktiverade lösningar med Raspberry Pi.

Skriva Python-skript för ljuddetektering

Nu när du har installerat Snowboy och konfigurerat ljudinställningarna, låt oss gå igenom hur du skriver ett enkelt Python-skript för att detektera hotwords.

Skapa en ny Python-fil: Öppna din textredigerare och skapa en fil, t.ex. hotword_detection.py.
Importera nödvändiga moduler: I ditt Python-skript, börja med att importera de moduler du behöver:

import snowboydec, sys
from os import path

Initiera Snowboy: Skapa en instans av Snowboy-dekodern:

detector = snowboydec.HotwordDetector("ditt_hotword.model", sensitivity=0.5)

Lyssna efter hotword: Använd en loop för att lyssna efter ljud och detektera hotword:

while True:
    detector.start(detected_callback=detektering_callback)

Definiera callback-funktionen: Skapa en funktion som triggas när ditt hotword detekteras:

def detected_callback():
    print("Hotword detected!")

Kör skriptet: Spara filen och kör den via terminalen:

python3 hotword_detection.py

På detta sätt kan du enkelt skriva och köra ditt egna Python-skript som använder Snowboy för ljuddetektering.

Registrera och lagra ljudprover

För vissa applikationer kan det vara användbart att registrera ljudprover och spara dem för senare analys. Här är hur du kan göra det:

Skapa en metod för att registrera ljud: Använd PyAudio för att fånga ljud från din mikrofon:

import pyaudio
import wave

def record_audio(filename):
    chunk = 1024
    sample_format = pyaudio.paInt16
    channels = 2
    fs = 44100
    seconds = 5

    p = pyaudio.PyAudio()
    stream = p.open(format=sample_format, channels=channels,
                    rate=fs, input=True, frames_per_buffer=chunk)

    frames = []

    print("Recording...")
    for _ in range(0, int(fs / chunk * seconds)):
        data = stream.read(chunk)
        frames.append(data)
    print("Finished recording.")
    
    stream.stop_stream()
    stream.close()
    p.terminate()

    wf = wave.open(filename, 'wb')
    wf.setnchannels(channels)
    wf.setsampwidth(p.get_sample_size(sample_format))
    wf.setframerate(fs)
    wf.writeframes(b''.join(frames))
    wf.close()

Integrera ljudregistreringen i callback: Du kan nu registrera ljudbaserat på detektering av hotword:

def detected_callback():
    print("Hotword detected! Recording...")
    record_audio("recording.wav")

Med den här metoden kan du enkelt registrera och spara ljudprover baserat på hotword detektering.

Alternativa tjänster: Porcupine

Även om Snowboys tjänst för träning av nya modeller är inaktiv, finns det alternativ som Porcupine. Porcupine erbjuder en liknande funktionalitet men med en avgiftsbaserad modell för att träna nya hotwords. För dem som letar efter en mer avancerad och aktivt underhållen plattform kan Porcupine vara rätt väg att gå.

Betalning för träning: För att använda Porcupine måste du betala för att skapa och träna anpassade hotwords, vilket är en skillnad mot Snowboys tidigare kostnadsfria tjänst.
Kompatibilitet: Porcupine är också kompatibelt med Python och kan enkelt integreras med dina existerande projekt.
Support och dokumentation: Porcupine erbjuder omfattande dokumentation och support, vilket gör det enklare för utvecklare att komma igång och anpassa sina appar.

Det är viktigt att överväga dessa alternativ när man bygger röstaktiverade tjänster för att säkerställa du använder den bästa plattformen för dina specifika behov.

Sammanfattning

I denna guide har vi utforskat hur man kan använda Snowboy för hotword detektering på din Raspberry Pi. Vi började med installation av nödvändiga programvaror, konfiguration av ljudinställningar, och hur man skriver Python-skript för att detektera hotwords. Trots att Snowboys träningstjänst inte längre är aktiv, så har du fortfarande möjlighet att använda de befintliga modellerna.

Genom att registrera och lagra ljudprover, samt titta på alternativen som Porcupine, har vi också täckt hur du kan implementera en komplett röstaktiverad lösning. Med dessa verktyg kan du nu skapa din egen anpassade röstaktivering på Raspberry Pi, och vi hoppas att du ser fram emot att experimentera och använda tekniken på nya sätt.

Vanliga frågor (FAQ)

Kan jag träna nya hotwords med Snowboy?

Nej, Snowboys tjänst för att träna nya hotwords är inaktiverad sedan januari 2021, men befintliga modeller kan fortfarande användas.

Vad är Porcupine och hur skiljer det sig från Snowboy?

Porcupine är en alternativ tjänst för hotword detektion som kräver betalning för att träna anpassade modeller. Det har fler aktiva funktioner och support än Snowboy.

Vilka ljudformat stöder Snowboy?

Snowboy använder WAV-format för ljudinspelningar. Se till att dina ljudfiler är i rätt format för att undvika problem.

Resurser och referenser

Här är några användbara resurser för att fördjupa dina kunskaper och få stöd i ditt projekt:

Vi hoppas att denna guide till hotword detektion med Snowboy på Raspberry Pi hjälper dig att skapa dynamiska och röstaktiverade lösningar.

```

Tack för att du läste vår artikel, du kan se alla artiklar i våra webbkartor eller i Sitemaps

Tyckte du att den här artikeln var användbar? Hotword-detektering med Raspberry Pi och Snowboy: En guide Du kan se mer här NanoPi.

Niklas Andersson

Hej, jag heter Niklas Andersson och är en passionerad student på civilingenjörsprogrammet i elektronik och en entusiastisk bloggare. Redan som liten har jag varit nyfiken på hur elektroniska apparater fungerar och hur tekniken kan förändra våra liv. Denna nyfikenhet ledde till att jag började studera elektronikkonstruktion, där jag varje dag utforskar nya idéer, konstruktioner och innovativa lösningar.

Tack för att du läser innehållet i Maker Electronics

Se mer relaterat innehåll