Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 3.část
Zdroj:
root.cz
26.11.2024 (00:00)
it, počítače
Budeme se zabývat velmi často řešenou úlohou: analýzou, zda je předložený text spam nebo se jedná o jiný typ textu (ham). Při vektorizaci textu využijeme takzvané n-gramy. celý článek


Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP)
Zdroj:
root.cz
14.11.2024 (00:00)
it-pocitace
V článcích o scikit-learn jsme se zabývali zpracováním a predikcí numerických dat. Ovšem v praxi je zapotřebí pracovat i s dokumenty psanými v přirozeném jazyce. I v takových případech najde scikit-learn své využití.
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část
Zdroj:
root.cz
21.11.2024 (00:00)
it-pocitace
Dnes si vysvětlíme algoritmy pro vektorizaci jazykového korpusu, což je proces, při kterém se z jednotlivých textových dokumentů (každý dokument je představován řetězcem) konstruuje matice s numerickými hodnotami.
Datová analýza s využitím nástroje scikit-learn: první kroky
Zdroj:
root.cz
01.08.2024 (00:00)
it-pocitace
Datová analýza je velmi zajímavý a neustále se rozvíjející se obor. Své místo v něm má i knihovna scikit-learn běžící v ekosystému jazyka Python. Dnes si představíme naprosté základy této knihovny.
Rozpoznávání obrázků knihovnou Scikit-learn: první kroky
Zdroj:
root.cz
28.11.2023 (00:00)
it-pocitace
Dnes si ukážeme, jak využít knihovny Matplotlib, NumPy a Scikit-learn pro natrénování modelu určeného pro rozpoznávání obrázků. Zaměříme se přitom zejména na popis kooperace mezi těmito knihovnami.
Shluková analýza (clustering) a knihovna Scikit-learn (z plochy do 3D prostoru)
Zdroj:
root.cz
12.12.2023 (00:00)
it-pocitace
Třetí článek o shlukové analýze prováděné s využitím knihovny Scikit-learn je zaměřen na problematiku výpočtu shlukové analýzy v trojrozměrném prostoru (a obecně i v prostorech s vyšším počtem dimenzí).
Balíček scikit-learn: modely provádějící klasifikaci
Zdroj:
root.cz
08.08.2024 (00:00)
it-pocitace
Na úvodní článek o datové analýze s využitím knihovny scikit-learn dnes navážeme. Ukážeme si práci s modely provádějícími klasifikaci dat. Konkrétně se bude jednat o modely, které se „učí s učitelem“ – supervised learning.
Tokenizace textu: základní operace při zpracování přirozeného jazyka
Zdroj:
root.cz
12.03.2024 (00:00)
it-pocitace
Seznámíme se s knihovnou Tiktoken, která umožňuje takzvanou tokenizaci textu. Jedná se o jednu ze základních operací používaných v systémech pro zpracování přirozeného jazyka, což je bouřlivě se rozvíjející oblast.
Shluková analýza (clustering) a knihovna Scikit-learn
Zdroj:
root.cz
05.12.2023 (00:00)
it-pocitace
Knihovna Scikit-learn kromě modelů (a jejich tréninku) poskytuje i další nástroje. Jedním z užitečných nástrojů, které zde nalezneme, je podpora pro provádění takzvané shlukové analýzy (cluster analysis, clustering).
Balíček scikit-learn: trénink a předpovědi modelů provádějících regresní analýzu
Zdroj:
root.cz
22.08.2024 (00:00)
it-pocitace
Dokončíme popis problematiky modelů provádějících regresní analýzu. Ukážeme si, jak tyto modely natrénovat, jak zjistit, které atributy způsobují špatné předpovědi modelu i to, jak zjistit atributy způsobující nestabilitu předpovědí.
Balíček scikit-learn: modely provádějící regresní analýzu
Zdroj:
root.cz
15.08.2024 (00:00)
it-pocitace
Na článek, v němž jsme se zabývali základní problematikou modelů provádějících klasifikaci dat, dnes navážeme. Ukážeme si jeden z modelů, jenž namísto klasifikace provádí regresi. Jedná se o model lineární regresní analýzy.
Lexikální a syntaktická zdrojových kódů jazyka Go
Neuronové sítě v knihovně scikit-learn (2.část)
Funkcionální programování v Pythonu s využitím knihovny Toolz (2. část)
pgvector : vektorová databáze postavená na Postgresu
Křížová validace modelů v knihovně scikit-learn
Rozpoznávání obrázků s knihovnou scikit-learn
Od projektu Scikit-learn ke knihovně PyTorch
Shluková analýza (clustering) a knihovna Scikit-learn (2)
Neuronové sítě v knihovně scikit-learn: dokončení
Neuronové sítě v knihovně scikit-learn: vytvoření a učení malé sítě
Scikit-learn: jednoduchý a současně i univerzální model lineární regrese
Propojení Pythonu s nativními knihovnami s využitím balíčku cffi (2)
Využití Redisu z jazyka Clojure pomocí knihovny Carmine
Redukce atributů v datových sadách před tréninkem modelů ve scikit-learn
Využití Redisu z jazyka Clojure pomocí knihovny Carmine (dokončení)
Lexikální a syntaktická analýza zdrojových kódů programovacího jazyka Python
Programovací jazyk R: práce s maticemi
Lexikální a syntaktická analýza zdrojových kódů jazyka Go (2.část)
„Mine englisch is well.“ DeepL Write používá AI k opravě anglických a německých vět
[aktualita] Plzeňský SentiSquare získává milion eur na vývoj no-code NLP softwaru
BaCon: transpřekladač z jazyka BASIC do jazyka C
Lua Fun: knihovna pro zpracování konečných i nekonečných sekvencí v jazyce Lua
Programová tvorba diagramů v jazyku Clojure s využitím knihovny Rhizome
Komunikace se sloupcovými databázemi z jazyka Go: Parquet soubory (dokončení)
IBM otevřela v Praze centrum pro využití umělé inteligence
Tvorba grafů a diagramů s využitím doménově specifického jazyka nástroje Graphviz (2.část)
Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua (dokončení)
Pokročilý streaming založený na Apache Kafce, jazyku Clojure a knihovně Jackdaw (2. část)
[aktualita] Česká televize vypsala veřejnou zakázku na hloubkový audit nákladů
Podpora funkcionálního programovaní v jazyku Lua s využitím knihovny Moses (pokračování)
Převody zdrojových kódů z jazyka C do jazyka Go
Souběžné a paralelně běžící úlohy naprogramované v Pythonu
Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua
Technologie WebAssembly a GopherJS: předávání argumentů mezi Go a JavaScriptem (dokončení)