Počítačové vidění

22+ nejžádanějších open-source datových sad pro počítačové vidění

Algoritmus umělé inteligence je jen tak dobrý, jak dobrá jsou data, která do něj dodáváte.

Není to ani odvážné, ani netradiční tvrzení. Umělá inteligence se před několika desetiletími mohla zdát poněkud přitažená za vlasy, ale umělá inteligence a strojové učení od té doby ušly opravdu dlouhou cestu.

Počítačové vidění pomáhá počítačům porozumět a interpretovat štítky a obrázky. Když trénujete svůj počítač pomocí správného druhu obrázků, může získat schopnost detekovat, porozumět a identifikovat různé rysy obličeje, detekovat nemoci, řídit autonomní vozidla a také zachraňovat životy pomocí vícerozměrného skenování orgánů.

Předpokládá se, že dosáhne trh počítačového vidění $ 144.46 miliardy do roku 2028 ze skromných 7.04 miliardy dolarů v roce 2020, přičemž mezi lety 45.64 a 2021 vzrostla CAGR o 2028 %.

Některé z případů použití počítačového vidění jsou:

  • Lékařské zobrazování
  • Autonomní vozidlo
  • Rozpoznávání obličeje a předmětů
  • Identifikace závady
  • Detekce scény

Projekt obrazová datová sada krmíte a trénujete své strojové učení a úkoly počítačového vidění jsou klíčové pro úspěch vašeho projektu AI. Kvalitní datový soubor je poměrně těžké získat. V závislosti na složitosti vašeho projektu může získání spolehlivých a relevantních datových sad pro účely počítačového vidění trvat několik dní až několik týdnů.

Zde vám poskytujeme řadu (kategorizovaných pro vaši jednoduchost) open-source datových sad, které můžete ihned použít.

Úplný seznam datových sad počítačového vidění

Generál:

  1. IMAGEnet (Link)

    ImageNet je široce používaná datová sada a přichází s úžasnými 1.2 miliony obrázků rozdělených do 1000 kategorií. Tato datová sada je organizována podle hierarchie WorldNet a kategorizována do tří částí – trénovací data, popisky obrázků a ověřovací data.

  2. Kinetika 700 (Link)

    Kinetics 700 je obrovská vysoce kvalitní datová sada s více než 650,000 700 klipy 700 různých tříd lidských akcí. Každá z hromadných akcí má asi XNUMX videoklipů. Klipy v datové sadě mají interakce člověk-objekt a člověk-člověk, což se ukazuje jako docela užitečné při rozpoznávání lidských činů ve videích.

  3. CIFAR-10 (Link)

    CIFAR 10 je jedním z největších souborů dat počítačového vidění, který se může pochlubit 60000 32 barevnými obrázky 32 x 6000 reprezentujícími deset různých tříd. Každá třída má asi XNUMX obrázků používaných k trénování algoritmů počítačového vidění a strojového učení.

Rozpoznávání obličeje:

rozpoznání obličeje

  1. Označené Faces in the Wild (Link)

    Labeled Faced in the Wild je obrovský soubor dat obsahující více než 13,230 5,750 snímků téměř XNUMX XNUMX lidí zjištěných z internetu. Tato datová sada tváří je navržena tak, aby usnadnila studium neomezené detekce tváří.

  2. CASIA WebFace (Link)

    CASIA Web face je dobře navržená datová sada, která pomáhá strojovému učení a vědeckému výzkumu neomezeného rozpoznávání obličeje. S více než 494,000 10,000 obrázky téměř XNUMX XNUMX skutečných identit je ideální pro úlohy identifikace a ověřování obličejů.

  3. Dataset UMD Faces (Link)

    UMD čelí dobře anotované datové sadě, která obsahuje dvě části – statické obrázky a snímky videa. Soubor dat obsahuje více než 367,800 3.7 anotací obličejů a XNUMX milionu anotovaných video snímků předmětů.

Rozpoznávání rukopisu:

  1. Databáze MNIST (Link)

    MNIST je databáze obsahující vzorky ručně psaných číslic od 0 do 9 a obsahuje 60,000 10,000 a 1999 XNUMX tréninkových a testovacích obrázků. MNIST, který byl vydán v roce XNUMX, usnadňuje testování systémů zpracování obrazu v rámci Deep Learning.

  2. Datový soubor umělých znaků (Link)

    Artificial Characters Dataset jsou, jak název napovídá, uměle generovaná data, která deseti velkými písmeny popisují strukturu anglického jazyka. Dodává se s více než 6000 obrázky.

Pojďme dnes diskutovat o vašem požadavku na školení AI.

Detekce objektu:

  1. MS COCO (Link)

    MS COCO nebo Common Objects in Context je datová sada pro detekci a titulkování objektů.

    Má více než 328,000 80 snímků s detekcí klíčových bodů, detekcí více objektů, titulky a anotacemi segmentační masky. Dodává se s XNUMX kategoriemi objektů a pěti popisky na obrázek.

  2. LSUN(Link)

    LSUN, zkratka pro Large-scale Scene Understanding, má více než milion označených obrázků ve 20 kategoriích objektů a 10 scén. Některé kategorie mají téměř 300,000 300 obrázků, přičemž 1000 obrázků je speciálně pro ověření a XNUMX XNUMX obrázků pro testovací data.

  3. Domácí objekty(Link)

    Datový soubor Home Objects obsahuje anotované obrázky náhodných objektů z celého domu – kuchyně, obývacího pokoje a koupelny. Tato datová sada obsahuje také několik komentovaných videí a 398 nekomentovaných fotografií určených k testování.

Automobilový průmysl:

  1. Datová sada panoráma města (Link)

    Panoráma města je soubor dat, na který se lze dostat při hledání různých videosekvencí zaznamenaných z pouličních scén několika měst. Tyto snímky byly pořízeny po dlouhou dobu a za různých povětrnostních a světelných podmínek. Anotace jsou pro 30 tříd obrázků rozdělených do osmi různých kategorií.

  2. Barkley Deep Drive (Link)

    Barkley DeepDrive je speciálně navržen pro výcvik autonomních vozidel a má více než 100 tisíc komentovaných videosekvencí. Je to jeden z nejužitečnějších tréninkových dat pro autonomní vozidla při měnících se podmínkách vozovky a jízdy.

  3. Mapilární (Link)

    Mapillary má více než 750 milionů pouličních scén a dopravních značek po celém světě, což je velmi užitečné při trénování modelů vizuálního vnímání ve strojovém učení a algoritmech AI. Umožňuje vám vyvíjet autonomní vozidla, která vyhovují různým světelným a povětrnostním podmínkám a pohledům.

Lékařské zobrazování:

  1. Datový soubor otevřeného výzkumu Covid-19 (Link)

    Tato původní datová sada má asi 6500 pixelových polygonálních segmentací plic o AP/PA rentgenových snímcích hrudníku. Kromě toho je k dispozici 517 snímků rentgenových snímků pacientů s Covid-19 se štítky obsahujícími jméno, místo, podrobnosti o přijetí, výsledek a další.

  2. NIH databáze 100,000 XNUMX rentgenových snímků hrudníku (Link)

    Databáze NIH je jedním z nejrozsáhlejších veřejně dostupných souborů dat obsahujících 100,000 XNUMX rentgenových snímků hrudníku a související data užitečná pro vědeckou a výzkumnou komunitu. Má dokonce snímky pacientů s pokročilými plicními onemocněními.

  3. Atlas digitální patologie (Link)

    Atlas of Digital Pathology nabízí několik histopatologických snímků, celkem více než 17,000 100, z téměř XNUMX anotovaných snímků různých orgánů. Tato datová sada je užitečná při vývoji softwaru pro počítačové vidění a rozpoznávání vzorů.

Rozpoznávání scény:

Rozpoznání scény

  1. Rozpoznání vnitřní scény (Link)

    Indoor Scene Recognition je vysoce kategorizovaný datový soubor s téměř 15620 65 snímky objektů a vnitřních scenérií, které lze použít při strojovém učení a tréninku dat. Dodává se s více než 100 kategoriemi a každá kategorie má minimálně XNUMX obrázků.

  2. xView (Link)

    Jako jedna z nejznámějších veřejně dostupných datových sad obsahuje xView tuny anotovaných horních snímků z různých složitých a velkých scén. S asi 60 třídami a více než milionem instancí objektů je účelem této datové sady poskytnout lepší pomoc při katastrofách pomocí satelitních snímků.

  3. místa (Link)

    Places, datový soubor poskytnutý MIT, obsahuje více než 1.8 milionu obrázků z 365 různých kategorií scén. V každé z těchto kategorií je asi 50 obrázků pro ověření a 900 obrázků pro testování. Je možné naučit se funkce hloubkové scény pro vytvoření rozpoznávání scén nebo úloh vizuálního rozpoznávání.

Zábava:

  1. IMDB WIKI datový soubor (Link)

    IMDB – Wiki je jednou z nejpopulárnějších veřejných databází tváří označených adekvátně věkem, pohlavím a jmény. Má také asi 20 tisíc tváří slavných a 62 tisíc z Wikipedie.

  2. Tváře celebrit (Link)

    Celeb Faces je rozsáhlá databáze s 200,000 XNUMX komentovanými obrázky celebrit. Obrázky přicházejí se šumem na pozadí a variacemi pozice, takže jsou cenné pro trénování testovacích sad v úlohách počítačového vidění. Je to velmi výhodné pro dosažení vyšší přesnosti při rozpoznávání obličeje, úpravách, lokalizaci částí obličeje a dalších.

Nyní, když máte k dispozici obrovský seznam obrazových datových souborů s otevřeným zdrojovým kódem, které pohání váš stroj umělé inteligence. Výsledek vašich modelů umělé inteligence a strojového učení závisí především na kvalitě datových sad, na kterých je krmíte a trénujete. Pokud chcete, aby váš model umělé inteligence vyvolával přesné předpovědi, potřebuje kvalitní datové sady, které jsou agregované, označkované a označené k dokonalosti. Chcete-li umocnit úspěch vašeho systému počítačového vidění, musíte používat kvalitní obrazové databáze relevantní pro vaši vizi projektu. Pokud hledáte více takových datových sad Klikněte zde

Sociální sdílení

Mohlo by se vám také líbit