Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP)

Zdroj Zdroj: root.cz     14.11.2024 (00:00)     Sekcia it, počítače

V článcích o scikit-learn jsme se zabývali zpracováním a predikcí numerických dat. Ovšem v praxi je zapotřebí pracovat i s dokumenty psanými v přirozeném jazyce. I v takových případech najde scikit-learn své využití. celý článek

Související články
 
Ďalšie články
 

Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část

Zdroj Zdroj: root.cz     21.11.2024 (00:00)     Sekcia it-pocitace

Dnes si vysvětlíme algoritmy pro vektorizaci jazykového korpusu, což je proces, při kterém se z jednotlivých textových dokumentů (každý dokument je představován řetězcem) konstruuje matice s numerickými hodnotami.

 

Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 3.část

Zdroj Zdroj: root.cz     26.11.2024 (00:00)     Sekcia it-pocitace

Budeme se zabývat velmi často řešenou úlohou: analýzou, zda je předložený text spam nebo se jedná o jiný typ textu (ham). Při vektorizaci textu využijeme takzvané n-gramy.

 

Datová analýza s využitím nástroje scikit-learn: první kroky

Zdroj Zdroj: root.cz     01.08.2024 (00:00)     Sekcia it-pocitace

Datová analýza je velmi zajímavý a neustále se rozvíjející se obor. Své místo v něm má i knihovna scikit-learn běžící v ekosystému jazyka Python. Dnes si představíme naprosté základy této knihovny.

 

Rozpoznávání obrázků knihovnou Scikit-learn: první kroky

Zdroj Zdroj: root.cz     28.11.2023 (00:00)     Sekcia it-pocitace

Dnes si ukážeme, jak využít knihovny Matplotlib, NumPy a Scikit-learn pro natrénování modelu určeného pro rozpoznávání obrázků. Zaměříme se přitom zejména na popis kooperace mezi těmito knihovnami.

 

Shluková analýza (clustering) a knihovna Scikit-learn (z plochy do 3D prostoru)

Zdroj Zdroj: root.cz     12.12.2023 (00:00)     Sekcia it-pocitace

Třetí článek o shlukové analýze prováděné s využitím knihovny Scikit-learn je zaměřen na problematiku výpočtu shlukové analýzy v trojrozměrném prostoru (a obecně i v prostorech s vyšším počtem dimenzí).

 

Balíček scikit-learn: modely provádějící klasifikaci

Zdroj Zdroj: root.cz     08.08.2024 (00:00)     Sekcia it-pocitace

Na úvodní článek o datové analýze s využitím knihovny scikit-learn dnes navážeme. Ukážeme si práci s modely provádějícími klasifikaci dat. Konkrétně se bude jednat o modely, které se „učí s učitelem“ – supervised learning.

 

Tokenizace textu: základní operace při zpracování přirozeného jazyka

Zdroj Zdroj: root.cz     12.03.2024 (00:00)     Sekcia it-pocitace

Seznámíme se s knihovnou Tiktoken, která umožňuje takzvanou tokenizaci textu. Jedná se o jednu ze základních operací používaných v systémech pro zpracování přirozeného jazyka, což je bouřlivě se rozvíjející oblast.

 

Shluková analýza (clustering) a knihovna Scikit-learn

Zdroj Zdroj: root.cz     05.12.2023 (00:00)     Sekcia it-pocitace

Knihovna Scikit-learn kromě modelů (a jejich tréninku) poskytuje i další nástroje. Jedním z užitečných nástrojů, které zde nalezneme, je podpora pro provádění takzvané shlukové analýzy (cluster analysis, clustering).

 

Balíček scikit-learn: trénink a předpovědi modelů provádějících regresní analýzu

Zdroj Zdroj: root.cz     22.08.2024 (00:00)     Sekcia it-pocitace

Dokončíme popis problematiky modelů provádějících regresní analýzu. Ukážeme si, jak tyto modely natrénovat, jak zjistit, které atributy způsobují špatné předpovědi modelu i to, jak zjistit atributy způsobující nestabilitu předpovědí.

 

Balíček scikit-learn: modely provádějící regresní analýzu

Zdroj Zdroj: root.cz     15.08.2024 (00:00)     Sekcia it-pocitace

Na článek, v němž jsme se zabývali základní problematikou modelů provádějících klasifikaci dat, dnes navážeme. Ukážeme si jeden z modelů, jenž namísto klasifikace provádí regresi. Jedná se o model lineární regresní analýzy.

Lexikální a syntaktická zdrojových kódů jazyka Go

Křížová validace modelů v knihovně scikit-learn

Rozpoznávání obrázků s knihovnou scikit-learn

Od projektu Scikit-learn ke knihovně PyTorch

Shluková analýza (clustering) a knihovna Scikit-learn (2)

Neuronové sítě v knihovně scikit-learn (2.část)

Neuronové sítě v knihovně scikit-learn: dokončení

Neuronové sítě v knihovně scikit-learn: vytvoření a učení malé sítě

Scikit-learn: jednoduchý a současně i univerzální model lineární regrese

Propojení Pythonu s nativními knihovnami s využitím balíčku cffi (2)

Využití Redisu z jazyka Clojure pomocí knihovny Carmine

Funkcionální programování v Pythonu s využitím knihovny Toolz (2. část)

Využití Redisu z jazyka Clojure pomocí knihovny Carmine (dokončení)

Redukce atributů v datových sadách před tréninkem modelů ve scikit-learn

Lexikální a syntaktická analýza zdrojových kódů programovacího jazyka Python

Programovací jazyk R: práce s maticemi

„Mine englisch is well.“ DeepL Write používá AI k opravě anglických a německých vět

[aktualita] Plzeňský SentiSquare získává milion eur na vývoj no-code NLP softwaru

BaCon: transpřekladač z jazyka BASIC do jazyka C

Lua Fun: knihovna pro zpracování konečných i nekonečných sekvencí v jazyce Lua

Programová tvorba diagramů v jazyku Clojure s využitím knihovny Rhizome

Komunikace se sloupcovými databázemi z jazyka Go: Parquet soubory (dokončení)

IBM otevřela v Praze centrum pro využití umělé inteligence

Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua (dokončení)

[aktualita] Česká televize vypsala veřejnou zakázku na hloubkový audit nákladů

Podpora funkcionálního programovaní v jazyku Lua s využitím knihovny Moses (pokračování)

Převody zdrojových kódů z jazyka C do jazyka Go

Lexikální a syntaktická analýza zdrojových kódů jazyka Go (2.část)

Souběžné a paralelně běžící úlohy naprogramované v Pythonu

Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua

Knihovny s implementací generických datových typů pro programovací jazyk Go

Užitečná novinka v Go 1.22: vylepšení směrování v knihovně net/http

Standardní šablonovací systém jazyka Go a šablony HTML stránek

Faust: platforma pro proudové zpracování dat v Pythonu

 
Počasí Kurzy

1 € = 27.453   CZK

1 € = 0.7276   GBP

1 € = 1.0736   CHF

1 € = 4.1582   PLN

1 € = 1.1168   USD

Program

Markíza19:00 TELEVÍZNE NOVINY

 

Jednotka19:55 Góly - body - sekundy

 

Dvojka20:00 Záznam zo žrebovania: KENO 10, Keno Joker, Loto, Joker, Loto 5 z 35 (B)

 

JOJ19:30 NOVINY TV JOJ

 

Kompletný tv program

Reality Horoskopy

Beran: Ak sa vás partner pýta, ako využijete voľné dni, vy sa pýtajte, ako si ich predstavuje. Je možné, že sa s vami bude chcieť pochváliť a pozve vás medzi priateľov, na ich úsudku mu veľmi záleží.

Býk: Dnes zacítite pocit naplnenia a úspechu. A ak sa darí vám, vaši priatelia a známi môžu rovnako počítať s vašou podporou a pomocou. Čaká vás množstvo pracovných aj súkromných stretnutí, kde prejavíte svoju schopnosť prejaviť účasť a poskytnúť cennú radu.

Blíženci: Dnes je váš deň, tak to využite. Poteší vás nejaká dobrá správa. Všetko sa pohne dopredu. Rozdávajte okolo seba úsmevy a ukazujte veselú tvár, lebo nie ste tak chudí, aby ste trocha šťastia nemohli dať.

Rak: Ak sa budete dnes predbiehať v rade alebo nebudete radu rešpektovať, môžete prísť domov dosť zničený. Na vašom okolí potom bude vysvetliť vám, prečo tomu tak je.

Lev: Ak sa chcete hádať, uvedomte si, že deň vám dáva energiu, takže máte dosť síl, aby ste neuhli a vytrvali až do víťazného konca. Buď uhnete, alebo deň zakončíte ujmou na zdraví.

Panna: Dnes vám uspokojenie môže prinášať iba láska, ale pretože váš nepružný a konzervatívny postoj môže hocikoho odradiť, voľte radšej úsmev. Ak sa k vám opačné pohlavie dnes priblíži, využite svoje šance.

Váhy: Plný energie budete iba v dopoludňajších hodinách. Celý ďalší zbytok dňa budete vyžadovať citlivejšie a jemnejšie zachádzanie. Ak si to navzájom poskytnete s ostatnými, budete celkom v príjemnej pohode.

Štír: Neprehrabávajte vrecká svojmu partnerovi! List od nelegálneho partnera tam síce neobjavíte, ale mohli by ste nájsť podrobný rozpis všetkých domácich prác, ktoré chce vo voľných dňoch stihnúť, čo by vás spoľahlivo otrávilo.

Střelec: Nesmiete sa stať panovačnými až diktátorskými. Mohlo by to mať netušené následky. Hľadajte svoje prednosti a verte, že ste dobrý taký, aký ste. Vo vzťahu máte potrebu väčšej istoty, alebo by ste radi realizovali niečo, čo vám už dlho vŕta v hlave.

Kozoroh: Dovoľte si byť voľný a ničím nezaťažený, aj keď je situácia neúnosná a vy máte pocit, že sa vám niečo vymklo z rúk.

Vodnář: Vaša dnešná fyzická odolnosť sa nedá porovnávať so silnejším znameniami horoskopu. Potreba odpočinku je u vás proste vyššia, a tak pozorne vnímajte signály vášho tela, ktoré poukazuje na preťaženie organizmu.

Ryby: Pozor dajte pri vysvetľovaní hocičoho. Budete hovoriť rýchlejšie než normálne a môžete nechtiac vyrobiť dosť veľký trapas. Pokiaľ nemusíte, radšej sa k ničomu nevyjadrujte, najmä nie písomne.

Ďalšie horoskopy