Ml A Ai

Najlepších 10 algoritmov hlbokého vzdelávania, ktoré by mal vedieť každý nadšenec umelej inteligencie

Top 10 Deep Learning Algorithms That Every Ai Enthusiast Should Know

Domov Dátová veda Najlepších 10 algoritmov hlbokého vzdelávania, ktoré by mal vedieť každý nadšenec umelej inteligencie OdMehedi Hasan VDátová vedaML a AI 227 0

OBSAH

  1. Najlepšie algoritmy hlbokého učenia
    1. 01. Konvolučná neurónová sieť (CNN)
    2. 02. Rekurentné neurónové siete (RNN)
    3. 03. Dlhodobé krátkodobé pamäťové siete (LSTM)
    4. 04. Viacvrstvový Perceptron
    5. 05. Feed Forward Neural Networks
    6. 06. Radiálne základy Funkčné neurónové siete
    7. 07. Modulárne neurónové siete
    8. 08. Modely sekvencie na sekvenciu
    9. 09. Obmedzené stroje Boltzmann (RBM)
    10. 10. Autoenkodéry
  2. Koncové myšlienky

Hlboké vzdelávanie je v podstate podskupinou umelej inteligencie a strojového učenia. Typické Algoritmy AI a ML môže pracovať s množinami údajov, ktoré majú niekoľko stoviek funkcií. Obrázok alebo signál však môžu mať milióny atribútov. To je miesto, kde prichádzajú algoritmy hlbokého učenia. Väčšina algoritmov DL bola inšpirovaná ľudským mozgom nazývaným umelá neurónová sieť. Moderný svet vo veľkej miere využíva hlboké vzdelávanie. Od biomedicínskeho inžinierstva po jednoduché spracovanie obrazu - má svoje využitie. Ak sa chcete stať odborníkom v tejto oblasti, musíte prejsť rôznymi algoritmami DL. A práve o tom budeme dnes diskutovať.





Najlepšie algoritmy hlbokého učenia


Využívanie hlbokého vzdelávania sa vo väčšine oblastí výrazne zvýšilo. Hlboké učenie je pri práci s neštruktúrovanými údajmi primerane praktické, pretože dokáže spracovať obrovské množstvo funkcií. Na riešenie rôznych problémov sú vhodné rôzne algoritmy. Aby ste sa zoznámili s rôznymi algoritmami DL, uvedieme v zozname 10 najlepších algoritmov hlbokého vzdelávania, ktoré by ste ako nadšenec AI mali poznať.

01. Konvolučná neurónová sieť (CNN)


CNN je možno najpopulárnejšou neurónovou sieťou na spracovanie obrazu. CNN spravidla používa obrázok ako vstup. Neurónová sieť analyzuje každý pixel samostatne. Váhy a odchýlky modelu sa potom vyladia, aby sa na obrázku zistil požadovaný objekt. Rovnako ako ostatné algoritmy, údaje musia tiež prejsť fázou predbežného spracovania. CNN však potrebuje relatívne menej predbežného spracovania ako väčšina ostatných algoritmov DL.





cnn_algoritmus-algoritmus hlbokého učenia

Kľúčové vlastnosti



  • V každom algoritme počítačového videnia musí obrázok alebo signál prejsť procesom filtrovania. CNN má na toto filtrovanie mnoho konvolučných vrstiev.
  • Po konvolučnej vrstve zostáva vrstva ReLU. Skratka znamená Rectified Linear Unit. Vykonáva operácie s údajmi a vydáva upravenú mapu atribútov.
  • Opravenú mapu funkcií nájdeme z vrstvy ReLU. Potom prechádza cez združovaciu vrstvu. Ide teda v zásade o metódu vzorkovania.
  • Zdieľaná vrstva znižuje rozmer údajov. Zmenšením rozmerov je proces učenia sa relatívne lacný.
  • Spojovacia vrstva splošťuje dvojrozmerné matice z vektora agregovaných prvkov, aby sa vytvoril jediný dlhý, predĺžený sekvenčný vektor.
  • Plne prepojená vrstva nasleduje za združovacou vrstvou. Plne prepojená vrstva má v zásade niekoľko skrytých vrstiev neurónovej siete. Táto vrstva zaraďuje obrázok do rôznych kategórií.

02. Rekurentné neurónové siete (RNN)


RNNs sú akousi neurónovou sieťou, v ktorej je výsledok z predchádzajúcej fázy odovzdaný do súčasnej fázy ako vstup. Pri klasických neurónových sieťach nie sú vstup a výstup na sebe závislé. Keď však potrebujete predpovedať akékoľvek slovo vo vete, je potrebné vziať do úvahy predchádzajúce slovo. Predpoveď nasledujúceho slova nie je možná bez zapamätania si posledného slova. RNN prišli do priemyslu, aby vyriešili tieto typy problémov.

RNN_algoritmus-algoritmus hlbokého učenia

k akej chybe dôjde, ak zadáte nesprávny názov funkcie?

Kľúčové vlastnosti

  • Skrytý stav, ktorý ukladá určité detaily o cykle, je základným prvkom RNN. Napriek tomu základné vlastnosti RNN závisia od tohto stavu.
  • RNN majú pamäť, ktorá ukladá všetky údaje o výpočtoch. Využíva rovnaké nastavenia pre každý záznam, pretože prináša rovnaký výsledok vykonaním rovnakého príkazu na všetkých príjmoch alebo skrytých vrstvách.
  • RNN redukuje komplikácie premenou autonómnych aktivácií na závislé tým, že dáva všetkým úrovniam rovnaké predsudky a váhy.
  • Výsledkom je, že zjednodušuje proces učenia aktualizáciou parametrov a zapamätaním si predchádzajúcich výsledkov tým, že každý výsledok posúva na ďalšiu skrytú úroveň.
  • Navyše všetky tieto vrstvy je možné kombinovať do jednej opakujúcej sa vrstvy, pričom odchýlky a hmotnosti všetkých skrytých vrstiev sú rovnaké.

03. Dlhodobé krátkodobé pamäťové siete (LSTM)


Rekurentné neurónové siete alebo RNN v zásade pracujú s údajmi súvisiacimi s hlasom. S krátkodobou pamäťou však nefungujú dobre. Ak je reťazec dostatočne dlhý, budú mať problémy s prenosom informácií z jedného kroku do druhého. Ak sa pokúšate predpovedať niečo z určitého obsahu, RNN môžu minúť dôležité informácie. Na vyriešenie tohto problému vedci vyvinuli modernú verziu RNN s názvom LSTM. Tento algoritmus hlbokého učenia vylučuje problém s krátkodobou pamäťou.

Kľúčové vlastnosti

  • LSTM monitorujú údaje po celý čas. Pretože môžu sledovať predchádzajúce údaje, sú cenné pri riešení problémov časových radov.
  • Štyri aktívne vrstvy sa integrujú špeciálnym spôsobom do LSTM. V dôsledku toho majú neurónové siete štruktúru ako reťazec. Táto štruktúra umožňuje algoritmu extrahovať z obsahu malé informácie.
  • Bunkový stav a jeho mnohé brány sú jadrom LSTM. Bunkový stav slúži ako transportná cesta pre relevantné údaje, ktoré prechádzajú sekvenčným reťazcom.
  • Teoreticky si stav bunky môže zachovať potrebné detaily počas celého vykonávania sekvencie. Výsledkom je, že údaje z predchádzajúcich krokov si môžu nájsť cestu do ďalších časových krokov, čím sa znížia dopady na krátkodobú pamäť.
  • Okrem predikcie časových radov môžete LSTM použiť aj v hudobnom priemysle, rozpoznávaní reči, farmaceutickom výskume atď.

04. Viacvrstvový Perceptron


Miesto vstupu do komplikovaných neurónových sietí, kde vstupné údaje smerujú cez viacero úrovní umelých neurónov. Každý uzol je spojený s každým ďalším neurónom v nadchádzajúcej vrstve, čo vedie k úplne spojenej neurónovej sieti. Vstupná a výstupná vrstva sú k dispozícii a je medzi nimi skrytá vrstva. To znamená, že každý viacvrstvový perceptrón má najmenej tri vrstvy. Navyše má multimodálny prenos, čo znamená, že sa môže šíriť dopredu aj dozadu.

Kľúčové vlastnosti

  • Údaje prechádzajú vstupnou vrstvou. Potom algoritmus vynásobí vstupné údaje príslušnými váhami v skrytej vrstve a pridá sa predpätie.
  • Vynásobené údaje potom prejdú do aktivačnej funkcie. Podľa vstupných kritérií sa používajú rôzne aktivačné funkcie. Väčšina vedcov údajov napríklad používa funkciu sigmoidu.
  • Okrem toho existuje funkcia straty na meranie chyby. Najbežnejšie sa používajú strata denníka, priemerná štvorcová chyba, skóre presnosti atď.
  • Algoritmus hlbokého učenia navyše na zníženie strát používa techniku ​​spätného šírenia. Váhy a odchýlky sa potom zmenia pomocou tejto techniky.
  • Táto technika pokračuje, kým sa strata nestane minimom. Pri minimálnej strate je proces učenia sa údajne ukončený.
  • Viacvrstvový perceptron má mnoho použití, ako je komplexná klasifikácia, rozpoznávanie reči, strojový preklad atď.

05. Feed Forward Neural Networks


Najzákladnejší typ neurónovej siete, v ktorom vstupné informácie idú iba jedným smerom, vstupujú cez umelé neurónové uzly a odchádzajú cez výstupné uzly. V oblastiach, kde môžu alebo nemusia byť skryté jednotky, sú k dispozícii prichádzajúce a odchádzajúce vrstvy. Na základe toho ich možno klasifikovať ako viacvrstvové alebo jednovrstvové dopredné neurónové siete. Pretože FFNN majú jednoduchú architektúru, ich jednoduchosť môže byť výhodná v určitých aplikáciách strojového učenia.

feed_forward_neural_networks

Kľúčové vlastnosti

  • Dôkladnosť funkcie určuje počet vrstiev. Prenos nahor je jednosmerný, ale nedochádza k spätnému šíreniu.
  • Okrem toho sú hmotnosti pevné. Vstupy sú kombinované s váhami a odoslané do aktivačnej funkcie. Na tento účel sa používa funkcia klasifikácie alebo krokovej aktivácie.
  • Ak je sčítanie hodnôt viac ako vopred určený prah, ktorý je normálne nastavený na nulu, výsledok je spravidla 1. Ak je súčet menší ako prah, je výstupná hodnota spravidla -1.
  • Algoritmus hlbokého učenia môže vyhodnotiť výsledky svojich uzlov s požadovanými údajmi pomocou techniky známej ako pravidlo delta, ktorá umožňuje systému meniť svoje hmotnosti počas učenia a vytvárať presnejšie výstupné hodnoty.
  • Algoritmus však nemá žiadne husté vrstvy a spätné šírenie, čo nie je vhodné pre výpočtovo drahé problémy.

06. Radiálne základy Funkčné neurónové siete


Radiálna bázová funkcia analyzuje rozpätie akéhokoľvek bodu od stredu. Tieto neurónové siete majú dve úrovne. Po prvé, atribúty sa spájajú s funkciou radiálneho základu vo vnútornej vrstve. Potom pri výpočte rovnakého výsledku v ďalšej vrstve je braný do úvahy výstup týchto atribútov. Okrem toho má výstupná vrstva jeden neurón pre každú kategóriu. Algoritmus využíva podobnosť vstupu na vzorkovanie bodov z tréningových údajov, kde každý neurón uchováva prototyp.

Kľúčové vlastnosti

  • Každý neurón meria euklidovskú vzdialenosť medzi prototypom a vstupom, keď je potrebné zatriediť nový vstupný vektor, tj n-rozmerný vektor, ktorý sa pokúšate kategorizovať.
  • Po porovnaní vstupného vektora s prototypom poskytne algoritmus výstup. Výstup sa zvyčajne pohybuje od 0 do 1.
  • Výstup tohto neurónu RBF bude 1, keď sa vstup zhoduje s prototypom, a ako sa priestor medzi prototypom a vstupom zväčšuje, výsledky sa budú pohybovať smerom k nule.
  • Krivka vytvorená aktiváciou neurónov sa podobá štandardnej zvonovej krivke. Výstupnú vrstvu tvorí skupina neurónov.
  • V systémoch obnovy energie inžinieri často používajú neurónovú sieť s radiálnou bázou. V snahe obnoviť moc v čo najnižšom čase ľudia používajú túto neurónovú sieť v systémoch obnovy energie.

07. Modulárne neurónové siete


Modulárne neurónové siete na vyriešenie problému kombinujú niekoľko neurónových sietí. V tomto prípade rôzne neurónové siete fungujú ako moduly, pričom každý rieši časť problému. Integrátor je zodpovedný za rozdelenie problému na množstvo modulov a za integráciu odpovedí modulov tak, aby tvoril konečný výstup programu.

Jednoduché ANN nemôže v mnohých prípadoch poskytnúť adekvátny výkon v reakcii na problém a potreby. V dôsledku toho môžeme na riešenie tej istej výzvy vyžadovať viac ANN. Modulárne neurónové siete sú pri tom skutočne skvelé.

feed_forward_neural_networks-algoritmy hlbokého učenia

Kľúčové vlastnosti

  • Na vyriešenie celého problému sa ako moduly v MNN používajú rôzne ANN. Každá ANN symbolizuje modul a má na starosti riešenie určitého aspektu problému.
  • Táto metóda zahŕňa úsilie spolupráce medzi mnohými ANN. Cieľom je rozdeliť problém do rôznych modulov.
  • Každý ANN alebo modul je vybavený určitým vstupom podľa svojej funkcie. Početné moduly každý rieši svoj vlastný prvok problému. Toto sú programy, ktoré vypočítavajú zistenia.
  • Integrátor dostane analyzované výsledky. Úlohou integrátora je integrovať množstvo individuálnych odpovedí z mnohých ANN a vytvoriť kombinovanú odpoveď, ktorá slúži ako výstup systému.
  • Algoritmus hlbokého vzdelávania preto rieši problémy dvojdielnou metódou. Napriek početnému použitiu nie je bohužiaľ vhodný na problémy s pohyblivým cieľom.

08. Modely sekvencie na sekvenciu


Dve opakujúce sa neurónové siete tvoria model sekvencie k sekvencii. Tu je kodér na spracovanie údajov a dekodér na spracovanie výsledku. Kodér aj dekodér fungujú súčasne a používajú rovnaké alebo oddelené parametre.

Na rozdiel od skutočnej RNN je tento model obzvlášť užitočný, keď je množstvo vstupných údajov a veľkosť výstupných údajov rovnaké. Tieto modely sa používajú predovšetkým v systémoch odpovedania na otázky, strojových prekladoch a chatbotoch. Výhody a nevýhody sú však podobné ako u RNN.

Kľúčové vlastnosti

  • Architektúra kodéra a dekodéra je najzákladnejšou metódou výroby modelu. Dôvodom je, že kodér aj dekodér sú v skutočnosti modely LSTM.
  • Vstupné údaje idú do kodéra a ten transformuje celý vstupný údaj do vektorov vnútorného stavu.
  • Tento kontextový vektor sa snaží zahrnúť údaje pre všetky vstupné položky, aby pomohol dekodéru pri vytváraní správnych predpovedí.
  • Dekodér je navyše LSTM, ktorého počiatočné hodnoty sú vždy na koncových hodnotách enkodéra LSTM, tj. Kontextový vektor poslednej bunky kodéra ide do prvej bunky dekodéra.
  • Dekodér generuje výstupný vektor pomocou týchto počiatočných stavov a tieto výsledky berie do úvahy pre následné reakcie.

09. Obmedzené stroje Boltzmann (RBM)


Geoffrey Hinton prvýkrát vyvinul Restricted Boltzmann Machines. RBM sú stochastické neurónové siete, ktoré sa môžu učiť z pravdepodobnostnej distribúcie v rámci súboru údajov. Tento algoritmus hlbokého vzdelávania má mnoho použití, ako je učenie sa funkcií, spoločné dimenzovanie, znižovanie dimenzie, klasifikácia, modelovanie tém a regresia.

RBM vytvárajú základnú štruktúru Deep Belief Networks. Rovnako ako mnoho iných algoritmov majú dve vrstvy: viditeľnú a skrytú jednotku. Každá viditeľná jednotka sa spojí so všetkými skrytými jednotkami.

rbm_algoritmus-algoritmus hlbokého učenia

skontrolujte program Excel, či sa dve bunky zhodujú

Kľúčové vlastnosti

  • Algoritmus v zásade pracuje s kombináciou dvoch fáz. Jedná sa o prihrávku dopredu a dozadu.
  • Pri prechode dopredu RBM prijmú údaje a prevedú ich na sadu čísel, ktoré kódujú vstupy.
  • RBM integrujú každý vstup s vlastnou váhou a jediným celkovým zaujatím. Nakoniec je výstup technikou odovzdaný do skrytej vrstvy.
  • RBM získavajú túto zbierku celých čísel a transformujú ich na generovanie znovu vytvorených vstupov v spätnom priechode.
  • Zmiešajú každú aktiváciu s vlastnou hmotnosťou a celkovým skreslením pred odoslaním výsledku viditeľnej vrstve na obnovu.
  • RBM analyzuje zrekonštruované údaje na skutočný vstup vo viditeľnej vrstve, aby posúdil účinnosť výstupu.

10. Autoenkodéry


Autoenkodéry sú skutočne akousi dopredu neurónovou sieťou, kde sú vstup aj výstup podobné. V 80. rokoch minulého storočia Geoffrey Hinton vytvoril autoenkodéry, ktoré zvládajú problémy s učením bez dozoru. Sú to neurónové siete, ktoré opakujú vstupy zo vstupnej vrstvy do výstupnej vrstvy. Autoenkodéry majú množstvo aplikácií, vrátane objavovania liekov, spracovania obrazu a predikcie popularity.

Deep-Autoencoder-DAE

Kľúčové vlastnosti

  • Autoencoder tvoria tri vrstvy. Sú to kodér kodéra, kód a dekodér.
  • Dizajn Autoencoderu mu umožňuje prijímať informácie a transformovať ich do iného kontextu. Potom sa pokúsia znovu vytvoriť skutočný vstup čo najpresnejšie.
  • Vedci údajov to niekedy používajú ako filtračný alebo segmentačný model. Predpokladajme napríklad, že obrázok nie je jasný. Potom môžete pomocou automatického kódovača vytvoriť čistý obraz.
  • Autoenkodéry najskôr zakódujú obrázok a potom skomprimujú údaje do menšej podoby.
  • Nakoniec Autoencoder dekóduje obrázok, ktorý vytvorí obnovený obraz.
  • Existujú rôzne typy kodérov, z ktorých každý má svoje vlastné použitie.

Koncové myšlienky


Algoritmy hlbokého učenia sa za posledných päť rokov stali obľúbenými v širokom spektre spoločností. K dispozícii sú rôzne neurónové siete, ktoré pracujú oddelene a prinášajú oddelené výsledky.

Vďaka ďalším údajom a použitiu sa ešte viac naučia a rozvíjajú. Všetky tieto atribúty preslávili hlboké učenie medzi vedcami údajov. Ak sa chcete ponoriť do sveta počítačového videnia a spracovania obrazu, musíte mať o týchto algoritmoch dobrú predstavu.

Ak teda chcete vstúpiť do fascinujúcej oblasti dátovej vedy a získať ďalšie znalosti o algoritmoch Deep Learning, naštartujte a prečítajte si článok. Tento článok prináša predstavu o najznámejších algoritmoch v tejto oblasti. Samozrejme, nemohli by sme uviesť všetky algoritmy, iba tie dôležité. Ak si myslíte, že sme niečo zmeškali, dajte nám vedieť v komentári nižšie.

zdieľam Facebook Twitter Pinterest WhatsApp ReddIt Telegram Viber

    ZANECHAŤ ODPOVEĎ zrušiť odpoveď

    Komentár: Zadajte svoj komentár! Meno:* Sem zadajte svoje meno E -mail:* Zadali ste nesprávnu e -mailovú adresu! Sem zadajte svoju e -mailovú adresu Webové stránky:

    Uložiť moje meno, e -mail a webovú stránku do tohto prehliadača, aby som mohol najbližšie komentovať.

    spot_img

    Najnovší príspevok

    Android

    10 najlepších aplikácií na výmenu tváre pre zariadenia Android a iOS

    OS Windows

    Ako naplánovať systém Windows 10 na automatické vyprázdnenie koša

    Android

    10 najlepších fakturačných aplikácií pre zariadenia s Androidom na rýchle zaplatenie

    OS Windows

    10 najlepších softvérových benchmarkov GPU pre váš počítač

    Musíš si prečítať

    Dátová veda

    20 najlepších nástrojov na vizualizáciu dát, ktoré potrebuje každý dátový vedec

    ML a AI

    10 najlepších programovacích jazykov pre AI a strojové učenie

    ML a AI

    Najlepších 20 algoritmov, metód a techník AI a strojového učenia

    Dátová veda

    Dátová veda vs. strojové učenie: 15 najlepších vecí, ktoré potrebujete vedieť

    Súvisiaci príspevok

    Najlepších 10 nápadov na projekty hlbokého vzdelávania pre začiatočníkov a profesionálov

    10 rozvíjajúcich sa trendov hlbokého vzdelávania, ktoré je potrebné sledovať v blízkej budúcnosti

    10 hlavných konceptov internetu vecí a M2M, ktorým musíte porozumieť

    10 najlepších domácich automatizácií využívajúcich IoT (internet vecí)

    10 najlepších bezplatných programovacích grafických používateľských rozhraní pre R.

    Najlepších 10 trendov spracovania prirodzeného jazyka (NLP), na ktoré sa môžete pozerať dopredu



    ^