De wereld van neurale netwerken

AI ALGEMEEN

AI EN CREATIVITEIT

CHATBOTS

AI-VIDEO'S YOUTUBE

AI-TOOLS

AI-TOEPASSINGEN

PROMPTING

LINKS

VEELGESTELDE VRAGEN

WORKSHOPS

BEGRIPPEN

AI IN GROTE LIJNEN

← volgend artikel vorig artikel →

De wereld van neurale netwerken

Laatst bijgewerkt: 25 november 2024

Deze samenvatting en de inhoudsopgave onder de video hebben we de AI-assistent NotebookLM van Google laten maken.

Samenvatting

De video legt op begrijpelijke wijze de structuur van een eenvoudig neuraal netwerk uit, gebruikmakend van de herkenning van handgeschreven cijfers als voorbeeld. Het beschrijft de werking van neuronen, lagen (input, hidden, output), gewichten en biases, en hoe deze samenwerken om informatie te verwerken.

De wiskundige basis wordt beknopt uitgelegd, met behulp van matrix-vector vermenigvuldiging.

Tot slot wordt kort de ontwikkeling van de sigmoïde functie naar de ReLU functie besproken, ter verbetering van trainingsprocessen.

Duik in de wereld van neurale netwerken

Bron: Fragmenten uit “Maar wat is een neuraal netwerk? | Deep Learning hoofdstuk 1”

Deel 1: De magie van beeldherkenning en de uitdaging van programmeren

De video opent met de verbazingwekkende vaardigheid van de hersenen om handgeschreven cijfers te herkennen, zelfs met variaties in pixels en belichting.
Vervolgens wordt benadrukt hoe moeilijk het is om een programma te schrijven dat hetzelfde kan doen, wat de relevantie van machine learning en neurale netwerken aantoont.
De video belooft de kijker te begeleiden in het begrijpen van de structuur van een neuraal netwerk en hoe het “leert”.

Deel 2: Structuur van een neuraal netwerk voor handgeschreven cijferherkenning

De video introduceert een eenvoudig neuraal netwerk met drie lagen: een invoerlaag, een verborgen laag en een uitvoerlaag.
De invoerlaag bestaat uit 784 neuronen, die overeenkomen met de pixels van een 28×28 afbeelding.
De uitvoerlaag heeft 10 neuronen, die elk een cijfer van 0 tot 9 vertegenwoordigen.
De verborgen laag, met een arbitrair gekozen aantal neuronen (16 in dit geval), blijft voorlopig een mysterie.

Deel 3: De hoop en de intuïtie achter de gelaagde structuur

De video verkent de hoop dat de verborgen lagen abstracte kenmerken leren, zoals randen en patronen, die bijdragen aan de cijferherkenning.
De analogie wordt gemaakt met menselijke herkenning, waarbij we cijfers opsplitsen in componenten zoals lussen en lijnen.
De verwachting is dat neuronen in de verborgen lagen deze subcomponenten leren herkennen en combineren.

Deel 4: Wiskundige werking van neuronen en verbindingen

De video zoomt in op een enkel neuron in de verborgen laag en legt uit hoe het de invoer van de vorige laag verwerkt.
Gewichten worden toegekend aan verbindingen tussen neuronen, waardoor een gewogen som van de activeringen van de vorige laag wordt berekend.
Een bias wordt toegevoegd aan deze som om de drempelwaarde voor activering te bepalen.
De sigmoidfunctie wordt gebruikt om de gewogen som te transformeren naar een waarde tussen 0 en 1, wat de activering van het neuron vertegenwoordigt.

Deel 5: Het enorme aantal parameters en het concept van ‘leren’

De video benadrukt het enorme aantal parameters (gewichten en biases) in het netwerk, wat de complexiteit illustreert.
Het “leren” van het netwerk wordt beschreven als het vinden van de juiste waarden voor al deze parameters, zodat het de taak van cijferherkenning kan uitvoeren.
Het idee om deze parameters handmatig in te stellen wordt geopperd, wat inzichten kan bieden in de werking van het netwerk.

Deel 6: Compacte notatie en het netwerk als een functie

De video introduceert een compacte notatie met matrices en vectoren om de berekeningen in het netwerk efficiënter te beschrijven.
Het hele netwerk wordt gezien als een complexe functie die 784 invoerwaarden (pixels) omzet in 10 uitvoerwaarden (cijferkansen).

Deel 7: Vooruitblik op het leerproces en alternatieven voor de sigmoidfunctie

De video belooft in de volgende video te bespreken hoe het netwerk leert en wat het werkelijk doet.
In een gesprek met Lisha Li, een expert op het gebied van deep learning, wordt de sigmoidfunctie besproken en alternatieven zoals ReLU genoemd.
ReLU wordt beschouwd als gemakkelijker te trainen, vooral voor diepe neurale netwerken.