Hvis der er uklarheder i denne artikel, bedes du se den originale engelske version.

Implementer hurtigt kraftfuld og effektiv AI og maskinlæring ved hjælp af Renesas RA8M1 MCU'er

Af Kenton Williston

Bidraget af DigiKeys nordamerikanske redaktører

Stigningen i kunstig intelligens (AI), maskinlæring (ML) og andre beregningsintensive arbejdsbelastninger ved netværkskanten til Internet of Things (IoT) lægger en ekstra behandlingsbelastning på mikrocontrollere (MCU'er). Håndteringen af disse nye arbejdsbelastninger øger strømforbruget, selv når designerne bliver bedt om at minimere strømforbruget og fremskynde time-to-market.

Designere har brug for en computermulighed, der bevarer MCU'ens effektivitet og samtidig tilføjer højtydende funktioner, der er skræddersyet specifikt til brug med lavt strømforbrug. Denne mulighed bør også bevare de enkle implementeringsmodeller, der er forbundet med traditionelle MCU'er, samtidig med at der tilføjes tilstrækkelige funktioner til at understøtte de sofistikerede applikationer, der muliggøres af AI og ML, såsom stemmestyring og forebyggende vedligeholdelse.

Denne artikel diskuterer de faktorer, der driver efterspørgslen efter AI og ML, og forklarer, hvorfor der er brug for nye processorarkitekturer for at levere disse funktioner effektivt. Derefter introduceres RA8M1 MCU-familien fra Renesas, og det vises, hvordan den kan bruges til at opfylde disse krav.

Kravene til kant-AI og -ML

Efterspørgslen efter AI og ML stiger i kant-IoT-applikationer, der spænder fra bygningsautomatisering og industrielle enheder til husholdningsapparater. Selv relativt små indlejrede systemer med lavt strømforbrug får nu til opgave at udføre opgaver som søgeordsspotting, stemmestyring og lyd- og billedbehandling. Anvendelsesområderne omfatter sensorhubs, dronenavigation og -kontrol, augmented reality (AR), virtual reality (VR) og kommunikationsudstyr.

For at minimere energiforbrug, omkostninger og ventetid og samtidig sikre privatlivets fred foretrækkes det ofte at behandle data på kanten frem for at sende dem til skyen. Det er en udfordring for designere, da kantenheder ofte har begrænsede ressourcer, især når de er batteridrevne.

Forbedrede MCU'er til kant-computing

AI- og ML-arbejdsbelastninger involverer typisk at udføre den samme matematiske operation gentagne gange på tværs af et stort datasæt. Disse arbejdsbelastninger er velegnede til acceleration ved hjælp af SIMD-behandling (single instruction, multiple data). SIMD udfører flere matematiske operationer parallelt, hvilket giver betydeligt højere kapacitet og bedre energieffektivitet end konventionel behandling.

Fordi traditionelle MCU'er mangler SIMD-funktionalitet, har de brug for hjælp til at udføre AI- og ML-arbejdsbelastninger. En løsning er at bruge en digital signalprocessor (DSP) eller andre SIMD-acceleratorer sammen med MCU'en. Denne tilgang med flere processorer komplicerer dog systemdesignet.

En anden mulighed er at skifte til en mere højtydende mikroprocessorenhed (MPU) med SIMD-funktioner. Det kan give den nødvendige ydelse i en enkeltprocessoropsætning, men MPU'er har kompromiser i strømforbrug og funktionssæt. For eksempel er ikke alle MPU'er designet til at levere den deterministiske, lav-latency computing, der kræves i MCU-orienterede applikationer.

Muliggør AI og ML i MCU'er

I erkendelse af behovet for en optimeret serie af MCU'er til understøttelse af AI- og ML-arbejdsbelastninger introducerede Renesas RA8M1 MCU-serien (figur 1). Serien er baseret på en Arm® Cortex®-M85-arkitektur med Helium og TrustZone, og de kan køre ved 480 megahertz (MHz) med et typisk strømforbrug på 225 mikroampere pr. megahertz (µA/MHz).

Diagram over Renesas RA8M1 MCU (klik for at forstørre)Figur 1: Renesas RA8M1 MCU er baseret på en Arm Cortex-M85 og inkluderer Helium-teknologi til at accelerere AI- og ML-behandling. (Billedkilde: Renesas)

RA8M1 MCU er designet til effektiv ydeevne og lavt strømforbrug og har funktioner som determinisme, kort afbrydelsestid og avanceret strømstyringsunderstøttelse. Processoren opnår en præstationseffektivitet på 6,39 CoreMark pr. megahertz (CoreMark/MHz).

Helium er en SIMD MVE (M-Profile Vector Extension), der accelererer signalbehandling og ML betydeligt. Den tilføjer 150 skalar- og vektorinstruktioner og gør det muligt at behandle 128-bit registre (figur 2). Den er optimeret til ressourcebegrænsede mikrocontrollere med lavt strømforbrug. For eksempel genbruger Helium FPU-registrene (floating-point unit) i stedet for at introducere nye SIMD-registre. Det er med til at sænke processorens strømforbrug og reducere designkompleksiteten.

Diagram over Helium genbruger FPU-registerbanken til vektorbehandlingFigur 2: Helium genbruger FPU-registerbanken til vektorbehandling. (Billedkilde: Arm)

Som det fremgår af figur 3, indeholder RA8M1's Cortex-M85 Arms TrustZone-teknologi. TrustZone giver hardwareisolering til kritisk firmware, aktiver og private oplysninger. Cortex-M85 tilføjer også nye sikkerheds- og tryghedsfunktioner, såsom udvidelsen PACBTI (pointer authentication and branch target identification). Disse sikkerhedsfunktioner er særligt værdifulde i en AI-sammenhæng, hvor en enhed kan interagere med personlige data.

Billede af Arm Cortex-M85's TrustZoneFigur 3: Cortex-M85's TrustZone giver hardwareisolering til kritisk firmware, aktiver og private oplysninger. (Billedkilde: Arm)

Hardwarefunktioner, man skal kigge efter i en AI-kompatibel MCU

En MCU skal kombinere effektiv ydeevne med et robust funktionssæt for at understøtte AI-applikationer. RA8M1 er veludstyret til motorstyring, programmerbar logisk styring (PLC), måling og andre industrielle og IoT-applikationer.

For eksempel kræver AI-algoritmer meget hukommelse. RA8M1-systemhukommelsen omfatter op til 2 megabyte (MB) flash og 1 MB SRAM. SRAM'en indeholder 128 kilobyte (Kbytes) tæt koblet hukommelse (TCM), som giver hurtig hukommelsesadgang til højtydende beregninger.

For at sikre pålidelig drift er 384 Kbytes af bruger-SRAM'en og hele 128 Kbytes af TCM konfigureret som ECC (error correcting code). De 32 Kbyte store instruktions- og datacacher er også ECC-beskyttede.

RA8M1 indeholder flere sikkerhedsfunktioner ud over dem, der er inkluderet i Arm-kernen. Disse omfatter RSIP-kryptografimotoren (Reprogrammable Secure Intellectual Property) til sikker databehandling, uforanderlig lagring til beskyttelse af kritiske data og mekanismer til beskyttelse mod manipulation.

Til kommunikationsgrænseflader er MCU'en udstyret med Ethernet til netværkstilslutning, CAN FD (Controller Area Network Flexible Data Rate) til bil- og industriapplikationer og USB High-Speed/Full-Speed til generel tilslutning. Den har også en kameragrænseflade og en oktal SPI (Serial Peripheral Interface) med dekryptering på farten til ekstern hukommelse.

Analoge grænseflader omfatter 12-bit analog-til-digital-konvertere (ADC'er) og digital-til-analog-konvertere (DAC'er), analoge højhastighedskomparatorer og tre sample-and-hold-kredsløb. Til seriel kommunikation understøtter RA8M1 flere protokoller, herunder en SCI (Serial Communication Interface) med SPI, en UART (Universal Asynchronous Receiver/Transmitter) og I²C (Inter-Integrated Circuit) tilstande. MCU'en har også I3C (Improved Inter-Integrated Circuit), som øger dataoverførselshastigheden og effektiviteten.

Udviklere, der har brug for fuld adgang til disse input/output (I/O)-funktioner, kan bruge en BGA-pakke (ball grid array) som R7FA8M1AHECBD#UC0 med 224-ben. Dem, der ønsker en mere strømlinet design- og monteringsproces for printkort, kan overveje at bruge en LQFP-mulighed (low profile quad flat package) som R7FA8M1AHECFB#AA0 med 144-ben.

Udviklingsmiljøer til AI-applikationer

Designere, der er interesserede i at eksperimentere med RA8M1-serien, kan starte med EK-RA8M1 R7FA8M evalueringskortet (figur 4). Dette kort indeholder en RJ45 RMII Ethernet-grænseflade, en USB High-Speed Host and Device-grænseflade og et tre-benet CAN FD-headerstik. Som hukommelse har den 64 Mbyte oktal SPI-flash.

Billede af Renesas EK-RA8M1 evalueringskort (klik for at forstørre)Figur 4: EK-RA8M1 evalueringskort har robust I/O-understøttelse til træning af RA8M1 MCU. (Billedkilde: Renesas)

RA8M1 understøttes af Renesas FSP (Flexible Software Package), en omfattende ramme, der er designet til at give en brugervenlig, skalerbar softwarebase af høj kvalitet til design af indlejrede systemer.

Pakken indeholder udviklingsværktøjer, herunder det integrerede udviklingsmiljø (IDE) e² studio, der er baseret på det populære Eclipse IDE. Det indeholder også to fremtrædende, royaltyfrie realtidsoperativsystemer: Azure RTOS og FreeRTOS.

Pakken indeholder lette, produktionsklare drivere, der understøtter almindelige brugsscenarier i indlejrede systemer. Kombineret med evalueringskortet giver disse drivere udviklere en hurtig vej til at eksperimentere med RA8M1 I/O.

Konklusion

RA8M1 giver udviklere en ny mulighed for at implementere AI- og ML-arbejdsbelastninger for kant IoT-applikationer, der sparer strøm, forbedrer ydeevnen, reducerer kompleksiteten og forkorter time-to-market.

DigiKey logo

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

Om denne forfatter

Image of Kenton Williston

Kenton Williston

Kenton Williston received his B.S. in Electrical Engineering in 2000 and started his career as processor benchmark analyst. Since then he worked as an editor with the EE Times group and helped launch and lead multiple publications and conferences serving the electronics industry.

Om udgiveren

DigiKeys nordamerikanske redaktører