Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP)
Zdroj: root.cz 14.11.2024 (00:00) it, počítače
V článcích o scikit-learn jsme se zabývali zpracováním a predikcí numerických dat. Ovšem v praxi je zapotřebí pracovat i s dokumenty psanými v přirozeném jazyce. I v takových případech najde scikit-learn své využití. celý článek
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část
Zdroj: root.cz 21.11.2024 (00:00) it-pocitace
Dnes si vysvětlíme algoritmy pro vektorizaci jazykového korpusu, což je proces, při kterém se z jednotlivých textových dokumentů (každý dokument je představován řetězcem) konstruuje matice s numerickými hodnotami.
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 3.část
Zdroj: root.cz 26.11.2024 (00:00) it-pocitace
Budeme se zabývat velmi často řešenou úlohou: analýzou, zda je předložený text spam nebo se jedná o jiný typ textu (ham). Při vektorizaci textu využijeme takzvané n-gramy.
Datová analýza s využitím nástroje scikit-learn: první kroky
Zdroj: root.cz 01.08.2024 (00:00) it-pocitace
Datová analýza je velmi zajímavý a neustále se rozvíjející se obor. Své místo v něm má i knihovna scikit-learn běžící v ekosystému jazyka Python. Dnes si představíme naprosté základy této knihovny.
Rozpoznávání obrázků knihovnou Scikit-learn: první kroky
Zdroj: root.cz 28.11.2023 (00:00) it-pocitace
Dnes si ukážeme, jak využít knihovny Matplotlib, NumPy a Scikit-learn pro natrénování modelu určeného pro rozpoznávání obrázků. Zaměříme se přitom zejména na popis kooperace mezi těmito knihovnami.
Shluková analýza (clustering) a knihovna Scikit-learn (z plochy do 3D prostoru)
Zdroj: root.cz 12.12.2023 (00:00) it-pocitace
Třetí článek o shlukové analýze prováděné s využitím knihovny Scikit-learn je zaměřen na problematiku výpočtu shlukové analýzy v trojrozměrném prostoru (a obecně i v prostorech s vyšším počtem dimenzí).
Balíček scikit-learn: modely provádějící klasifikaci
Zdroj: root.cz 08.08.2024 (00:00) it-pocitace
Na úvodní článek o datové analýze s využitím knihovny scikit-learn dnes navážeme. Ukážeme si práci s modely provádějícími klasifikaci dat. Konkrétně se bude jednat o modely, které se „učí s učitelem“ – supervised learning.
Tokenizace textu: základní operace při zpracování přirozeného jazyka
Zdroj: root.cz 12.03.2024 (00:00) it-pocitace
Seznámíme se s knihovnou Tiktoken, která umožňuje takzvanou tokenizaci textu. Jedná se o jednu ze základních operací používaných v systémech pro zpracování přirozeného jazyka, což je bouřlivě se rozvíjející oblast.
Shluková analýza (clustering) a knihovna Scikit-learn
Zdroj: root.cz 05.12.2023 (00:00) it-pocitace
Knihovna Scikit-learn kromě modelů (a jejich tréninku) poskytuje i další nástroje. Jedním z užitečných nástrojů, které zde nalezneme, je podpora pro provádění takzvané shlukové analýzy (cluster analysis, clustering).
Balíček scikit-learn: trénink a předpovědi modelů provádějících regresní analýzu
Zdroj: root.cz 22.08.2024 (00:00) it-pocitace
Dokončíme popis problematiky modelů provádějících regresní analýzu. Ukážeme si, jak tyto modely natrénovat, jak zjistit, které atributy způsobují špatné předpovědi modelu i to, jak zjistit atributy způsobující nestabilitu předpovědí.
Balíček scikit-learn: modely provádějící regresní analýzu
Zdroj: root.cz 15.08.2024 (00:00) it-pocitace
Na článek, v němž jsme se zabývali základní problematikou modelů provádějících klasifikaci dat, dnes navážeme. Ukážeme si jeden z modelů, jenž namísto klasifikace provádí regresi. Jedná se o model lineární regresní analýzy.
Lexikální a syntaktická zdrojových kódů jazyka Go
Křížová validace modelů v knihovně scikit-learn
Rozpoznávání obrázků s knihovnou scikit-learn
Od projektu Scikit-learn ke knihovně PyTorch
Shluková analýza (clustering) a knihovna Scikit-learn (2)
Neuronové sítě v knihovně scikit-learn (2.část)
Neuronové sítě v knihovně scikit-learn: dokončení
Neuronové sítě v knihovně scikit-learn: vytvoření a učení malé sítě
Scikit-learn: jednoduchý a současně i univerzální model lineární regrese
Propojení Pythonu s nativními knihovnami s využitím balíčku cffi (2)
Využití Redisu z jazyka Clojure pomocí knihovny Carmine
Funkcionální programování v Pythonu s využitím knihovny Toolz (2. část)
Využití Redisu z jazyka Clojure pomocí knihovny Carmine (dokončení)
Redukce atributů v datových sadách před tréninkem modelů ve scikit-learn
Lexikální a syntaktická analýza zdrojových kódů programovacího jazyka Python
Programovací jazyk R: práce s maticemi
„Mine englisch is well.“ DeepL Write používá AI k opravě anglických a německých vět
[aktualita] Plzeňský SentiSquare získává milion eur na vývoj no-code NLP softwaru
BaCon: transpřekladač z jazyka BASIC do jazyka C
Lua Fun: knihovna pro zpracování konečných i nekonečných sekvencí v jazyce Lua
Programová tvorba diagramů v jazyku Clojure s využitím knihovny Rhizome
Komunikace se sloupcovými databázemi z jazyka Go: Parquet soubory (dokončení)
IBM otevřela v Praze centrum pro využití umělé inteligence
Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua (dokončení)
[aktualita] Česká televize vypsala veřejnou zakázku na hloubkový audit nákladů
Podpora funkcionálního programovaní v jazyku Lua s využitím knihovny Moses (pokračování)
Převody zdrojových kódů z jazyka C do jazyka Go
Lexikální a syntaktická analýza zdrojových kódů jazyka Go (2.část)
Souběžné a paralelně běžící úlohy naprogramované v Pythonu
Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua
Knihovny s implementací generických datových typů pro programovací jazyk Go
Užitečná novinka v Go 1.22: vylepšení směrování v knihovně net/http
Standardní šablonovací systém jazyka Go a šablony HTML stránek