Licence a podpora | Statistica.pro

Zavřít

Unikátní know-how a špičkové analytické nástroje

Představujeme vám, jak maximálně využít nástroje pro zpracování a vyhodnocení dat.

Web STATISTICA.PRO je tu, aby Vám představil nástroje a postupy, které vedou k maximálnímu využití dat, ať už ve vašem nebo korporátním byznyse. Web Vám nabídne detailní popis nástrojů společnosti TIBCO Sotware Inc. a know-how spojené s implementací těchto a dalších nástrojů do specifických odvětví podnikání.

TIBCO Software Inc. je americká společnost poskytující firmám integraci, analýzu a zpracování dat pro použití on-premise nebo v prostředí cloud computingu. Nabízí software spravující informace a podporující rozhodování a optimalizace procesů a pro více než 10 000 zákazníků. Klienti zahrnují společnosti AirFrance, KLM, Citi, Conway, ING, Marks a Spencer, Nielsen, Shell, University of Chicago Medicine, Western Union. Společnost je novým vlastníkem nástroje Statistica, společnosti StatSoft (www.statsoft.cz)

STATISTICA.PRO nabízí know-how a nástroje pro samotnou realizaci datové extrakce z různých datových zdrojů, následné vyhodnocení dat a další zpracování ve formě reportů nebo napojení na systémy třetích stran.

Využijte našich zkušeností z implementace projektu v oblasti PRŮMYSLU 4.0 a nechte si vypracovat kompletní strategii datového zpracování. Poptejte konkrétní systém, který by Vaše požadavky vyřešil nebo se přihlašte na některý z našich kurzů, který se pokročilým vyhodnocením dat zabývá.

Zanechte nám vzkaz a my se Vám ozveme:

Zavřít

04 / 04 / 2018

Jsou vypsané květnové a červnové termíny na kurzy

Obnovené tradiční kurzy na celou škálu analytických metod a také na ovládání nástroje STATISTICA jsou vypsány na květen a srpen. Hlaste se přes formuláře pod vybranným kurze. V případě, že je již garantovaný termín, je u kurzu již konkrétní datum konání.

Zavřít

01 / 04 / 2018

Statistica 13: Novinky v nové verzi

Neznáte Statisticu? Tak začněte tady:
Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších. O využití softwaru se lze dočíst v sekci Publikační činnost a v záložce Případové studie. Analytická platforma Statistica umožní organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do provozu.

Statisticu znám a chci vedět, co je nového:
Statistica 13 - je nejnovější verze analytického softwaru, která přináší mnoho významných vylepšení.

Stručný výčet těch nejdůležitějších novinek v aktuální verzi:

Možnost definovat si analytické workflow nyní pro všechny verze –rozhraní Statistica Workspace bylo významně vylepšeno a je k dispozici v každé verzi softwaru Statistica.

Manuální kroková regrese – k manuální (uživatel si sám může volit v každém kroku, které prediktory přidá, nebo odstraní) krokové logistické regresi byla přidána i klasická lineární a Coxova regrese.

Posílení dataminingových algoritmů pro řešení Statistica Data Miner – pro posílení dataminingových algoritmů byly přidány krokové modelovací techniky. Hlavní výhodou krokové výstavby modelu je možnost ručně přidávat nejdůležitější prediktory a sledovat jejich vliv na model. Funkcionalita what-if umožní definovat modely, které jsou v souladu se směrnicemi a politikou společnosti. Více informací se dočtete zde.

Nový modul pro vizualizaci dat – Statistica Interactive Visualizations & Dashboards. Jde o nový modul pro pokročilou a interaktivní vizualizaci dat, který umožní snadnou vizualizaci rozsáhlých a dynamicky se měnicích dat (obchodní data, energetika, průmysl atd.). Díky tomuto modulu budete mít neustálý přehled o vývoji klíčových údajů. Tento modul je součástí trial verze Statistica 13.

Big Data – pokročilá platforma pro analýzu těch nejrozsáhlejších datových zdrojů. Díky mnoha vylepšením (Native Distributed Analytics (NDA), analytika nad Hadoop atd.) umožňuje řešení Statistica zpracovávat obrovské objemy dat s maximální efektivitou. Více informací se lze dočíst zde.

Další informace o posledních novinkách (Edge scoring atd.) se dočtete zde, dále také na http://statistica.io.

Zavřít

Zvýhodněné programy pro školy

Akademická sféra

Statistica do škol
Výhody pro školy
Akademické programy

TIBCO Statistica™ je trvale uznávána jako jeden z nejintuitivnějších a nejsnadněji použitelných softwaru pro zpracování dat na trhu.

Proč byste měli používat právě TIBCO Statistica™?

Snadné použití
Není potřeba kódování - Pokud víte, jak používat aplikace Microsoft Windows, jako je Excel nebo Word, pak víte, jak používat TIBCO Statistica™.

Komplexní algoritmy pro strojové učení a text mining – Statistica
Obsahuje komplexní výběr clusteringových technik, architektury neuronových sítí, klasifikačních / regresních stromů (také nazývaných rekurzivní dělící metody), multivariační modelování (včetně MARSplines) a mnoho dalších prediktivních technik pro strukturované i nestrukturované údaje.

Tzv. Drag-and-drop UI pro snadné vkládání dat
Grafické nástroje pro vytváření dotazů usnadňují přímé napojení na externí databáze. Přehledně vytvářejí, spravují a ukládají vlastní pracovní postupy s možnostmi vyhledávání.

Bezproblémová integrace s jazyky C #, R a Python.
Pokud píšete skripty jazyce C #, R nebo Python, bude se vám Statistica líbit. Statistica přečte a zapisuje data z prakticky všech standardních formátů souborů, včetně starších a konkurenčních produktů.

Nízké náklady pro akademickou sféru
Chápeme rozpočtové omezení, kterým čelí fakulty a studenti ve vzdělávacích institucích, a proto se snažíme dělat Statisticu cenově přístupnou. Neváhejte nás oslovit pro konkrétní nabídku.

Budoucnost vašeho povolání
Protože je široce využívána mimo akademickou sféru. Zkušenosti se Statistica zvýší vaší pracovní kvalifikaci. Budete připraveni nabídnout své dovednosti do oblastí s vysokou poptávkou zahrnující populární Big Data, prediktivní analýzu, internet věcí a mnohé další.

Výhody TIBCO Statistica™, které pro Vás umíme zajistit:

TIBCO Statistica™ v češtině
Jediný lokalizovaný komplexní profesionální systém (aktuálně verze 12.x)

Reference a případové studie z celého světa
TIBCO Statistica™ se využívá například na Yale University, Cambridge University, ,Masarykově univerzitě v Brně, Mendelově univerzitě v Brně, ČZU v Praze, VŠCHT v Praze, UTB ve Zlíně či v Akademii věd ČR.

Kvalifikovaná školení práce s produktem i s daty
Kromě elektronické učebnice a výukových materiálů nabízíme také školení na samotné ovládání nástroje nebo na příbuzná analytická témata. Školení vedou kvalifikovaní odborníci z akademické sféry i z praxe.

Aktuální program TIBCO Statistica™ pro školy
Tento projekt je určen speciálně pro školy, tak aby měly k dispozici špičkový analytický software lokalizovaný do češtiny, a mohly se zabývat vlastní analýzou dat a interpretací výsledků.
Software je přitom univerzitě poskytnut za zvýhodněných podmínek, aby byl co nejvíce přístupný všem členům akademické obce. Studenti tak přímo na univerzitě přicházejí do styku s profesionálním softwarem, což je pro ně vklad na celý život.
Související služby zahrnují jak podporu co nejrychlejšího využívání software, tak i konzultace vlastních metod analýzy dat. Studenti i pedagogové se např. mohou účastnit našich kurzů (http://www.datascript.cz/kurzy/tibco-statistica) za zvýhodněných podmínek.

Tento projekt již aplikovaly pro své studenty například Česká zemědělská univerzita v Praze, Masarykova univerzita, Mendelova univerzita v Brně, Univerzita Palackého v Olomouci, Vysoké učení technické Brno, Jihočeská univerzita v Českých Budějovicích, VŠCHT, Univerzita Karlova - 1.lékařská fakulta a další.

Akademická multilicence
Speciálně v rámci tohoto projektu existuje možnost rozsáhlého počtu instalací pro celofakultní či celouniverzitní využití.

Co Vám přinese tato volba?

software pro všechny a všude (studenti, zaměstnanci, ve škole, doma, na noteboocích atd.)
možnost dlouhodobější spolupráce – 1 - 5 let
díky tomuto projektu získáte velké cenové zvýhodnění oproti jiným organizacím
všechny upgrady a technická podpora jsou zdarma po dobu užívání softwaru
software je automaticky v češtině i v angličtině – vynikající možnost pro výuku zahraničních studentů

Cena tohoto řešení je odvozena od počtu instalací a dle vybraných modulů.
Neváhejte nás kontaktovat a nechat si připravit individuální nabídku

Zavřít

Pokročilá analytika pro vědu a výzkum

Výzkum a vývoj

Zavřít

Naplnění iniciativy, Analýza výrobních linek, SW podpora

Průmysl 4.0

Zavřít

Machine learning, Analýza velkých dat

Big Data

Zavřít

MES, Prediktivní modely, SixSigma

Výroba

Zavřít

Datová integrace, Pokročilá analytika, Big Data

Farmacie

Zavřít

Rozhodovací modely, Risk Management, Real-Time Monitoring transakcí nebo Strojové učení. Know-how, reference a celosvětově uznávané nástroje na zpracování dat.

Bankovní služby

Back-office proces

Naše technologie umožňují integrovat a v reálném čase extrahovat několik procesů najednou. Takové datové extrakce zvyšují produktivitu, snižují dobu zpracování a snižují náklady. Nabízíme zavedení parametrizovatelných workflow, pokročilé analytiky či real-timového streamování.

Řízení rizik

Poskytuje výkon a rychlost potřebnou pro výpočet rizik za zlomek nákladů oproti tradičním řešením. Inovace v oblasti veřejných a soukromých cloudových technologií umožňují urychlit rozhodovací procesy a získat tak konkurenční výhodu v celé řadě agend souvisejících s vyhodnocením rizik a to včetně: oceňování aktiv, vysokofrekvenční obchodování (HFT), management obchodních rizik a v risk reportingu.

Dohled nad platebními transakcemi

Retailové banky či banky pro správu majetku mohou výrazně redukovat míru "falešně pozitivních" nálezů, a to pomocí schopností strojového učení. Dokážeme modely přizpůsobit jednoduchým přidáním nových atributů nebo změnou klíčových parametrů.

Jaké produkty můžeme doporučit:

TIBCO Statistica
TIBCO Spotfire
TIBCO StreamBase

Zavřít

Datová integrace, analýza dat

GDPR

Zavřít

Integrace dat, Analitika senzorů, Alerting

IOT (Internet of Things)

Zavřít

04 / 04 / 2018
Obecná analýza dat
Pro všechny

Analýza síly testu

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Kurz se věnuje práci s modulem analýza síly testu. Posluchači se dozví, na jakém principu je stanoven minimální rozsah vzorku dat pro dosažení konkrétního typu testu o dané síle, jak tento odhad získat, jak v TIBCO Statistica stanovit sílu testu.

Určení velikosti vzorku je jeden z důležitých kroků před provedením jakéhokoli experimentu či studie a může ušetřit spoustu problémů vzniklých vyhodnocováním nesprávně navrhnuté studie.

Cílová skupina

Kdokoli, kdo uvažuje o plánování experimentu a zajímá se, jak velký vzorek dat musí nasbírat.
Typickým publikem jsou především lidé zpracovávající data z oblasti medicíny či farmacie.

Cíle kurzu

Pochopení toho, proč je nutné zabývat se analýzou síly testu.
Naučit se, jak stanovit minimální počet potřebných pozorování pro dosažení potřebné síly testu.
Detailní seznámení s modulem Analýza síly testu.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Princip testování hypotéz

Vybrané statistické testy a jejich použití

Určení síly testu

Určení minimálního rozsahu vzorku dat

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování.

Předchozí kurzy

Vhodné je absolvovat před tímto kurzem některý kurz zahrnující teorii testování hypotéz:

Základní kurz statistiky I,

Analýza rozptylu.

Navazující kurzy

Jelikož kurz pokrývá nejrůznější metody testování hypotéz, mohou být pro účastníky zajímavé kurzy detailně rozebírající teorii k daným testům. Například:

Analýza rozptylu,

Analýza přežití,

Analýza kategoriálních dat,

Základní kurz statistiky,

Statistika v lékařství I.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

04 / 04 / 2018
Obecná analýza dat
Pro profesionály

Analýza přežití

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Cílem jednodenního kurzu je seznámit účastníky se základními statistickými metodami používanými v analýze přežití. Kurz je určen především zájemcům, kteří se zabývají biomedicínským výzkumem, ale i jinými oblastmi, kde se pracuje s neúplnými (cenzorovanými) daty týkajících se dob do sledované události. Všechny probírané metody budou procvičeny na konkrétních příkladech.

Cílová skupina

Kdokoli, kdo se setkává s cenzorovanými daty (doby do sledované události).
Zájemci, zabývající se biomedicínským výzkumem.
Může se hodit také zájemcům jiným medicínských oborů, ale také zájemcům z oblasti financí či průmyslu.

Cíle kurzu

Porozumět podstatě a rozdílu cenzurovaných dat.
Naučit se metody, které byly pro tento typ dat odvozeny.
Naučit se interpretovat výsledky metod a to nejen číselné, ale i grafické.
Dokázat si zpracovat samostatně data pomocí softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Úvod do analýzy přežití

Základní pojmy: doba do události, typy cenzorování
Rozdělení doby do události: funkce přežití, riziková funkce

Jednovýběrový problém

Kaplanův-Meierův odhad funkce přežití
Úmrtnostní tabulky

Srovnání dvou skupin

Logrankový test, zobecněné Wilcoxonovy testy

Regresní analýza

Coxův model proporcionálních rizik
Parametrické regresní modely

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.

Navazující kurzy

Kurz Analýza přežití je speciální kurz pro specifický typ dat a pokrývá základ této problematiky, stejně jako funkcionality softwaru, navazující kurz na stejné téma tedy není. Pro vzdělávání v dalších oblastech analýzy dat si můžete vybrat z nabídky našich kurzů podle problematiky, kterou hledáte.

Vzhledem k častému využití v medicíně můžeme doporučit následující kurzy:

Analýza rozptylu,

Statistika v lékařství II,

Analýza síly testu ve STATISTICA.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

04 / 04 / 2018
Obecná analýza dat
Pro všechny

Ovládání programu TIBCO Statistica

1

Zelený Pruh 95/97, Praha 4

5490,- Kč bez DPH

Tento jednodenní kurz je určen těm, kteří se zajímají o možnosti získávání a vyhodnocování informací z textových dokumentů, nejčastěji z webových zdrojů, ale i ze souboru textových dokumentů nebo různých databází. Cílem kurzu je ukázat možnosti jak pracovat s vágními textovými informacemi a jak z nich získat užitečnou informaci pro další zpracování a rozhodování. Využití text miningu lze spatřovat například v oblasti sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cílová skupina

Analytici, datoví specialisté či statistici, kteří chtějí využít informace v datech ve formě nestrukturovaného textu.
Text mining se využívá v oblastech sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cíle kurzu

Ukázat, jak a čím může být metodologie text miningu přínosná.
Pochopit, jak může v úlohách text miningu přispět software TIBCO Statistica.
Ukázat si, jaké všechny možnosti a nastavení lze použít.
Vysvětlit si pojmy, které se běžně v souvislosti s text miningem vyskytují
Naučit se, jak využít získanou informaci ve formě indexového souboru pro další analýzy.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy
Seznámení s prostředím TIBCO Statistica
Načtení dat, různé typy výstupů, získání dat z databáze
Možnosti grafických výstupů

Účel, princip a zdroje text miningu

Nastavení podmínek pro prohledávání a nastavení filtrů

Výběr jazyka, zastoupení slov,…
Nastavení frází, povolených, zakázaných slov, synonym
Nastavení délky slov, max. počet souhlásek, povolených znaků, atd.

Vytvoření a práce s indexovým souborem a frekvenční maticí

Výběr významných příznaků (prediktorů) pro klasifikační úlohu

Klasifikace

Klasifikační stromy
Metody strojového učení
Neuronové sítě

Shluková analýza nad získanými daty

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.

Navazující kurzy

Logickým navázáním na kurz je detailní vysvětlení metodologie, jak používat výsledky z textminingové analýzy.

Vhodnými tedy mohou být kurzy:

Data Mining (dvoudenní nebo třídenní varianta)
Neuronové sítě
Klasifikační a regresní stromy

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

04 / 04 / 2018
Obecná analýza dat
Pro všechny

Analýza kategoriálních dat

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Cílem jednodenního kurzu je seznámit účastníky se základními statistickými metodami určenými pro řešení problémů zahrnujících kategoriální (kvalitativní) data. Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech. Důraz je kladen na praktické použití daných metod a na interpretaci výsledků.

Cílová skupina

Kdokoli, kdo pracuje či potřebuje zpracovávat kategoriální data.
Metody jsou univerzální a použitelné pro nejrůznější obory, pro je kurz určen širokému okruhu zájemců.

Cíle kurzu

Porozumět základním metodám pro analýzu kategoriálních dat
Umět vyhodnocovat a interpretovat výsledky těchto metod.
Umět získat výsledky za pomoci softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Popisná statistika

Statistické metody pro proporce

Analýza závislosti dvou dichotomických znaků (kontingenční tabulky 2x2)

Analýza závislosti dvou obecných kategoriálních znaků (kontingenční tabulky IxJ)

Statistické metody pro párová kategoriální data

Loglineární modely pro kontingenční tabulky (nástin)

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.
Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.

Navazující kurzy

Přímo navazujícím kurzem je kurz:

Logistická, multinomická a ordinální regrese.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro všechny

Analýza rozptylu

1 den

Zelený Pruh 95/97, 140 00 Praha 4

7900,- Kč bez DPH

Cílem tohoto jednodenního kurzu je představit metody pro porovnávání dvou a více skupin. Kurz se zabývá modely analýzy rozptylu (jednoduché, dvojné třídění, hierarchická ANOVA), zobecněním ANCOVA či MANOVA a alternativními neparametrickými metodami. Prostor je věnován i metodám pro ověření předpokladů a post-hoc testům pro mnohonásobná porovnání.

Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech.

Cílová skupina

Ti, kteří se chtějí naučit či rozšířit své znalosti v oblasti analýzy rozptylu. Tedy analýz, kde se práme, zda se nezávislý spojitý znak chová v různých skupinách stejně.

Cíle kurzu

Naučit se statisticky porovnávat data pro více skupin a interpretovat správně dosažené výsledky.
Naučit se, který typ analýzy použít pro daný úkol.
Naučit se principy metod nejen teoreticky, ale umět je použít i prakticky.
Naučit se, jak potřebné analýzy provést v programu TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Úvod do analýzy rozptylu

Zopakování principu testování hypotéz
Testy pro dva výběry (nepárové, párové a neparametrické)

Metody analýzy rozptylu

Ověřování předpokladů metod ANOVA
Jednofaktorová ANOVA
ANOVA pro opakovaná měření
Analýza kovariance
Hierarchická ANOVA
Vícerozměrná analýza rozptylu (MANOVA)

Neparametrické metody analýzy rozptylu

Kruskal-Wallisův test
Friedmanova ANOVA

Post-hoc testy

Fisherův, Scheffého,…

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.

Navazující kurzy

především s přihlédnutím na konkrétní typ analýz, které chce uživatel vykonávat.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro profesionály

Časové řady a predikce

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Dvoudenní kurz je určen všem, kteří chtějí porozumět metodám pro analýzu a modelování časových řad. Po úvodním seznámení se základními pojmy budou vysvětleny nejrůznější metody, které umožňují predikovat chování časových řad do budoucnosti a také ohodnotit správnost výsledků. Vše je demonstrováno na příkladech z praxe.

Cílová skupina

Kdokoli, kdo pracuje s časově zatíženými daty.
Typickými posluchači mohou být lidé z oblasti finančnictví, ale stejně tak třeba i oblasti průmyslu.

Cíle kurzu

Porozumět základním pojmům z oblasti časových řad.
Pochopit specifika práce s časovou řadou oproti ostatním datovým typům.
Naučit se běžně používaným metodám pro analýzu časových řad.
Naučit se vyhodnotit, která metoda je vhodná pro danou úlohu.
Praktické použití metodologie časových řad v softwaru TIBCO Statistica
Detailní seznámení s funkcionalitou Časové řady a predikce v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Úvod do časových řad

Příklady časových řad
Jednoduché modely časových řad:
Modely s nulovou střední hodnotou
Modely s trendem
Modely se sezónností
Stacionární modely
Autokorelační funkce
Odhady trendu a sezónních komponent
Filtrování trendu a sezónních komponent
Testování šumové náhodné posloupnosti

Stacionární procesy

Lineární modely
ARMA procesy
Autokorelační funkce (ACF)
Predikce stacionárních časových řad
Odhadování trendu a predikce pomocí regresní analýzy

Exponencionální vyrovnávání

Bez trendu
S trendem

ARMA modely

ACF a PACF pro ARMA ( p, q )
Predikce ARMA modelů
Odhad řádu ARMA

Nestacionární a sezonní modely

ARIMA modely
Identifikace
Predikce ARIMA modelů
Sezonní ARIMA modely

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Před tímto je vhodné absolvovat Základní kurz statistiky I.

Předchozí kurzy

Základní kurz statistiky I.

Navazující kurzy

Tématiku časových řad také částečně pokrývají dataminingové metody, konkrétně neuronové sítě, je tedy možné navštívit také kurzy:

Data mining (dvoudenní varianta) nebo

Data mining (třídenní varianta) nebo

Neuronové sítě.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro profesionály

Logistická, ordinální a multinomická regrese

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Cílem jednodenního kurzu je seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu. Posluchačům bude vysvětlen pojem poměru šancí (odds ratio) a jeho vztah k logistické regresi, jež umožňuje modelovat závislost 0/1 odezvy (typicky indikátoru zda nastala nebo nenastala nějaká událost) na kvalitativních i kvantitativních prediktorech obdobně jako v klasické lineární regresi. Model logistické regrese bude postupně dáván do souvislosti s klasickými postupy (dvouvýběrový t-test, analýza rozptylu, lineární regrese). V další části kurzu navážeme multinomickým logistickým modelem (multinomial logit model, umožňuje modelovat kategoriální odezvu) a dále modelem proporcionálních šancí (proportional odds model).

V poslední části ukážeme využití logistické regrese k vytvoření binárního klasifikátoru (diagnostický test) a vysvětlíme související pojmy sensitivity, specificity, pozitivní a negativní prediktivní hodnoty, ROC křivky. Jednotlivé metody budou ilustrovány na příkladech z lékařského i bankovního prostředí (credit skóring).

Cílová skupina

Statistici, datoví specialisté či analytici, kteří potřebují řešit úlohu predikce kategorické veličiny.
S potřebou takovýchto regresních modelů se setkáváme v oblasti bankovnictví, pojišťovnictví, medicíny, ale také například v oblasti společenských věd.
Ti, kteří se potřebují naučit, jak provést výše zmíněné typy regrese v softwaru TIBCO Statistica.

Cíle kurzu

Seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu.
Naučit posluchače pracovat a porozumět charakteristikám jako jsou poměr šancí nebo ROC křivka.
Naučit se vybrat, kterými metodami modelovat daná kategorická data, které proměnné přidat do finálního modelu a které ne.
Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Inference o proporci (stručně, je též obsahem kurzu „Analýza kategoriálních dat“)

Kvantifikace odlišnosti dvou skupin vzhledem k proporci

Rozdíl proporcí
Relativní riziko
Poměr šancí – odds ratio

Jednoduchá logistická regrese

Vícenásobná logistická regrese

Multinomická logistická regrese

Model proporcionálních šancí

Logistická regrese k vytvoření binárního klasifikátoru

Pojem ROC křivky

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows, výhodou je předchozí absolvování kurzu Analýza kategoriálních dat, ale není podmínkou.

Předchozí kurzy

Doporučujeme absolvovat kurz Analýza kategoriálních dat, na který kurz Logistické, ordinální a multinomické regrese logicky navazuje.

Navazující kurzy

Tématiku regresních modelů pro spojité veličiny je možné doplnit kurzy:

Analýza rozptylu,

Regresní analýza.

Možností, jak předpovídat kategorickou odezvu, je více. Mohou se hodit například dataminingové metody:

Klasifikační a regresní stromy nebo

Data mining (dvoudenní varianta) .

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro všechny

Neparametrická statistika

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Kurz je zaměřen na statistické metody, které nevyžadují nutně splnění předpokladů o pravděpodobnostním rozdělení náhodných veličin (normální, atd.), případně i jiných předpokladů. Tyto metody lze tedy univerzálně využívat napříč všemi obory. Kurz je určen všem, kteří se chtějí dozvědět o neparametrických alternativách klasickým testů.

Cílová skupina

Kurz je vhodný pro všechny, kteří mají ve svých datech problémy s dodržením předpokladů klasických metod.
Zájemce, kteří se chtějí dozvědět o alternativách základních parametrických charakteristik a testů.
Vědečtí pracovníci, kteří si chtějí ujasnit své postupy.
Kurz je vhodný pro ty, kteří chtějí doplnit své teoretické znalosti o této metodologii.
Typickými obory, kde jsou neparametrické metody potřeba, jsou oblasti medicíny a farmacie.

Cíle kurzu

Posluchači se naučí používat neparametrické alternativy klasických metod.
Naučit se ověřovat předpoklady metod.
Umět se rozhodnout, kterou metodu vybrat pro daná data.
Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Testy normality

Grafická analýza
Testy hypotéz o normálním rozdělení

Odlehlá pozorování

Příklady negativních důsledků přítomnosti odlehlých pozorování
Identifikace odlehlých hodnot (Grubbsův test, grafická identifikace)
Očištění datového souboru

Popisná statistika

Neparametrické míry polohy a variability
Boxplot
Bagplot

Neparametrické testy

Alternativy k t-testům
Neparametrická ANOVA
Testy pro kontingenční tabulky

Spearmanův korelační koeficient

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Základní kurz statistiky I nebo Statistika v lékařství I.

Navazující kurzy

Je možné rozšířit si znalosti o parametrických metodách a to prostřednictvím kurzů:

Analýza rozptylu,

Regresní analýza,

Základní kurz statistiky II.

Co se týče navázáním metodami, které nemají tak striktní předpoklady, pak lze doporučit pro regresní a klasifikační úlohy dataminingové metody:

Klasifikační a regresní stromy,

Neuronové sítě nebo

Data mining (dvoudenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro všechny

Praktická analýza dat

2

Zelený Pruh 95/97, Praha 4

12400,- Kč bez DPH

Dvoudenní kurz Praktická analýza dat je určen těm, kteří potřebují s analýzou začít, ale Základní kurz statistiky I má pro ně příliš širokou osnovu. Tento kurz klade důraz na procvičování samostatných úloh týkajících se zpracování dat z různých oblastí lidské činnosti. Podrobněji budou vysvětlena témata typy proměnných, popisná statistika, vizualizace výsledků, vztahy proměnných a interpretace výsledků.

Cílová skupina

Kurz je vhodný zejména pro ty, kteří se zpracování dat nikdy nevěnovali, začínají s ním, nebo pouze chtějí prohloubit své znalosti v oblasti Business intelligence.
Ti, kteří potřebují s analýzou dat začít, ale Základní kurz statistiky I má pro ně příliš širokou osnovu.

Cíle kurzu

Nosným cílem školení je předat účastníkům maximální know-how potřebné pro samostatnou práci nad daty
předat účastníkům maximální know-how potřebné pro samostatnou práci nad daty
Naučit účastníky porozumět základním statistickým přístupům, které budou využitelné v praxi při zpracování provozních dat.
Naučit se běžně využívané přístupy nejen teoreticky, ale i v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Úvod do analýzy dat

Proč to děláme
Typy proměnných (měřítka)
Načtení dat, různé typy výstupů
Příprava datového souboru (tvorba nových proměnných, překódování, filtrování)

Popisná statistika

Průměr, medián, míry variability
Základní přístupy k analýze dat podle typu proměnné (charakteristiky polohy a variability)
Vhodná vizualizace dat
Vliv a detekce odlehlých hodnot
Normální rozdělení a ověření normality dat

Vztah dvou veličin

Jak poznat vliv jiné proměnné na sledované hodnoty (vztah dvou veličin)
Korelace, kontingence (jednotlivé kroky, interpretace výsledků)

Vybrané pokročilejší metody

Úvod do statistického usuzování
Ukázky pokročilejších přístupů (vícerozměrná analýzy, modelování odezvy, data mining), aneb Rozšíření statistických obzorů

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.

Předchozí kurzy

Jedná se o úplně nejzákladnější kurz, není potřeba tedy absolvovat žádné předchozí kurzy.

Navazující kurzy

Navazujícím kurzem pro komplexní obecné vzdělávání je:

Základní kurz statistiky II, případně Základní kurz statistiky I, nicméně ten se částečně s kurzem Praktické analýzy dat překrývá.

Pokud si chcete rozšířit znalosti konkrétní problematiky, pak je pro Vás k dispozici celá řada specializovaných kurzů jako jsou:

Analýza rozptylu,

Regresní analýza,

Neparametrická statistika,

Analýza kategoriálních dat,

Vícerozměrné statistické metody,

Časové řady a predikce.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro všechny

Příprava a zpracování dat

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Příprava a zpracování dat patří mezi nejpracnější úkoly celého procesu analýzy dat. Tento jednodenní kurz Vám pomůže podrobně se seznámit s obsluhou softwaru TIBCO Statistica při přípravě datového souboru. Během kurzu bude účastník seznámen se základními postupy přípravy datového souboru před započetím vlastní analýzy. Bude prezentována široká škála postupů a funkcí, které umožňují průzkum datového souboru, úpravu dat, simulace chybějících hodnot, filtrace dat, vzorkování. Jedná se o vhodné doplnění znalostí k základním kurzům či kurzu data miningu.

Cílová skupina

Všichni, kteří se chtějí seznámit s postupy, jak správně připravit datový soubor před samotnou analýzou dat.
Všichni, kteří se chtějí seznámit s problémy, které se mohou vyskytovat v datech a také s metodami, jak tyto problémy odstranit.
Ti, kteří se chtějí naučit připravovat data v softwaru TIBCO Statistica.

Cíle kurzu

Porozumět nutnosti přípravy a zpracování dat.
Naučit se běžně využívané přístupy nejen teoreticky, ale i v softwaru TIBCO Statistica.
Umět si samostatně připravit data pro analýzu a vyřešit problémy, které se mohou v datech vyskytnout.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy
Seznámení s prostředím TIBCO Statistica

Plánování výzkumu

Datová reprezentace

Typy proměnných
Datová reprezentace v programu TIBCO Statistica

Očištění dat

Validace dat
Zpracování chybějících pozorování
Zpracování odlehlých pozorování

Úpravy dat

Standardizace
Transformace, dávková transformace
Překódováni
Tvorba nových proměnných pomocí vzorců
Přeskupování a seskupování
Filtrace

Vzorkování

Praktické zkušenosti

Běžné postupy
Na co si dávat pozor

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.

Předchozí kurzy

Tento kurz může doplnit znalosti z kurzů:

Základní kurz statistiky I či Praktická analýza dat. Pro absolvování nicméně tyto kurzy nejsou nutné.

Předzpracování dat je také velmi důležité pro oblast data miningu, tedy pro kurzy:

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Navazující kurzy

Navazujícím kurzem může být kterýkoli kurz zaměřující se na statistické metody.

Ať už je to:

Základní kurz statistiky II, Analýza rozptylu,

či další.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro profesionály

Regresní analýza

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Regresní analýza je jednou z nejpoužívanějších a nejrozšířenějších statistických metod vůbec. Jednodenní kurz je zaměřen zejména na modely lineární a nelineární regrese. Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech.

Cílová skupina

Kurz je vhodný pro všechny, kteří chtějí nebo potřebují analyzovat data pomocí regresní analýzy, tedy chtějí vyšetřovat závislost spojité veličiny na základě dalších spojitých veličin.
Kurz je vhodný pro ty, kteří chtějí doplnit teoretické znalosti o této metodologii.
Regresní analýza je univerzální metodou, prakticky tedy nelze říct, že by kurz byl vhodnější pro nějakou konkrétní oblast nebo výčet oblastí.
Ti, kteří se potřebují naučit, jak provést výše zmíněné typy regrese v softwaru TIBCO Statistica.

Cíle kurzu

Posluchač bude seznámen s úlohou regresní analýzy.
Naučit se ověřovat předpoklady použití regresního modelu.
Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Úvod do regresní analýzy

Lineární regresní modely

Ověření předpokladů
Jednoduchá regrese
Vícenásobná regrese
Polynomiální regrese (určení stupně polynomu)

Nelineární regresní modely

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Základní kurz statistiky I nebo Statistika v lékařství I.

Navazující kurzy

Tématiku regresních modelů pro jiné než spojité veličiny je možné doplnit kurzy:

Analýza rozptylu,

Logistická, ordinální a multinomická regrese.

Možností, jak řešit regresní úlohu je více, mohou pomoci například dataminingové metody:

Klasifikační a regresní stromy,

Neuronové sítě nebo

Data mining (dvoudenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro profesionály

Vícerozměrné statistické metody

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Dvoudenní kurz poskytne účastníkům přehled metod využívaných při explorativní analýze dat. Použitelnost těchto metod je velmi široká, sociálními vědami počínaje a hospodářstvím či marketingem konče. Všechny probírané metody (viz program kurzu) budou procvičeny na příkladech.

Účastníci si tak osvojí nejen znalost principů, ale i dovednost uplatnit metody v praxi. Kurz je rovněž vhodný pro uživatele systému STATISTICA, kteří se chtějí podrobněji seznámit s modulem STATISTICA Vícerozměrné průzkumné techniky.

Cílová skupina

Všichni, kteří potřebují zpracovávat vícerozměrná data.
Ti, kteří potřebují prohloubit své znalosti v oblasti diskriminační analýzy, tvorby shluků, predikování kategorické proměnné, hledání vztahů mezi skupinami proměnných apod.

Cíle kurzu

Naučit se teoretické i praktické využití vícerozměrných statistických metod.

Osnova

Úvod

Základní informace o softwaru STATISTICA
Výukové zdroje pro software a možnosti nápovědy

Analýza hlavních komponent (Principal Component Analysis)

Faktorová analýza (Factor Analysis)

Shluková analýza (Cluster Analysis)

Diskriminační analýza (Discriminant Analysis)

Kanonická korelace (Canonical Correlation Analysis)

Vícerozměrné škálování (Multidimensional Scaling)

Klasifikační stromy (Classification Trees)

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Základní znalost principů statistického uvažování či absolvování Základního kurzu statistiky I(kurz Vícerozměrné statistické metody je jeho vhodným rozšířením). Není ale podmínkou. Vhodný pro prohloubení znalostí vícerozměrných metod z kurzu Základní kurz statistiky II.

Předchozí kurzy

Vhodné je absolvovat tento kurz, nicméně není podmínkou:

Základní kurz statistiky I.

Také účastníci kurzu Základní kurz statistiky II mohou kurzem vícerozměrných metod rozšířit své znalosti.

Navazující kurzy

Kurzem pro další studium řešení podobných úloh může být kurz:

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro všechny

Základní kurz statistiky I

2

Zelený Pruh 95/97, Praha 4

12400,- Kč bez DPH

Základní kurz statistiky I Vám zprostředkuje pohled do světa statistických analýz. Cílem kurzu je naučit se efektivně získávat informace z dat a porozumět filozofii statistického zpracování dat. V úvodu jsou účastníci seznámeni s principy používání programu TIBCO Statistica, obsluhou jeho jednotlivých nástrojů a vybranými vhodnými funkcemi a vlastnostmi. Podrobněji budou vysvětlena témata popisná statistika, principy statistického usuzování a interpretace výsledků. Druhá část kurzu se věnuje statistickému rozhodování a vyšetření závislosti mezi proměnnými. Pro snazší pochopení dané problematiky budou v průběhu kurzu řešeny úlohy na reálných datech. Důraz je kladen na interpretaci výsledků a grafické možnosti systému TIBCO Statistica.

Kurz je určen zejména pro ty, kteří se statistickou analýzou dat začínají. Převážná část kurzu je věnována statistickému testování hypotéz (komparativní, párový pokus) parametrickými i neparametrickými testy, je proto vhodný také pro vědecké pracovníky, kteří si potřebují své postupy ujasnit/ potvrdit.

Cílová skupina

Úplné začátečníky v oblasti zpracování dat.
Všechny, kteří chtějí porozumět statistickému zpracování dat.
Vědečtí pracovníci, kteří si chtějí ujasnit své postupy.
Ti, kteří si potřebují vyhodnotit data z dotazníkových šetření.
Ekonomické pracovníky, kteří chtějí efektivně využívat zákaznická data (najít závislosti, pokročilou vizualizaci apod.)

Cíle kurzu

Pomoci začít s analýzami i úplným začátečníkům.
Naučit se dělat grafy pro různé typy dat.
Naučit porovnávat 2 skupiny (experimentální / kontrolní).
Pochopit rozdíl mezi párovým a nepárovým pokusem
Naučit se porovnávat více než 2 skupiny
Naučit se kvantifikovat závislosti mezi proměnnými (korelace, kontingence...)
Naučit se vytvářet modely typu „Co se stane, když…“
Naučit zpracovávat samostatně svá data v softwaru Dell Statistica pomocí odučených metod.

Osnova

Úvod
Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy
Základy obsluhy programu TIBCO Statistica
Seznámení s prostředím TIBCO Statistica
Načtení dat, různé typy výstupů
Vytvoření nové tabulky dat, vkládání a upravování dat
Možnosti grafických výstupů
Úvod do analýzy dat
- Co je to statistická analýza dat
Popisná statistika
Typy rozdělení proměnných
Charakteristiky polohy a variability
Vhodná vizualizace dat
Vztah dvou veličin
Normální rozdělení a ověření normality dat
Testování hypotéz
Úvod do testování hypotéz
Jednotlivé kroky testování hypotéz, interpretace výsledků
Vybrané statistické metody
Přehled některých základních testů a příklady jejich použití
Test nezávislosti dvou kategoriálních znaků, t-testy, analýza rozptylu, základní neparametrické testy, korelační analýza, lineární regrese

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. .

Předchozí kurzy

Pokud se chce posluchač plně soustředit na teorii, pak je výhodné před tímto kurzem absolvovat kurz:

Ovládání programu Statistica.

Navazující kurzy

Navazujícím kurzem pro komplexní obecné vzdělávání je:

Základní kurz statistiky II.

Pokud si chcete rozšířit znalosti konkrétní problematiky, pak je pro Vás k dispozici celá řada specializovaných kurzů jako jsou:

Analýza rozptylu,

Regresní analýza,

Neparametrická statistika,

Analýza kategoriálních dat,

Vícerozměrné statistické metody,

Časové řady a predikce.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Obecná analýza dat
Pro všechny

Základní kurz statistiky II

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Kurz je zaměřen zejména na obecné lineární modely (vícerozměrná regrese, analýza rozptylu) a na možnosti nelineárního modelování. Všechny probírané metody jsou procvičeny na konkrétních příkladech, vše s důrazem na praktické použití daných metod a interpretaci výsledků. Kurz je rovněž vhodný pro uživatele systému TIBCO Statistica, kteří se chtějí podrobněji seznámit s modulem STATISTICA Pokročilé lineární a nelineární modely.

Cílová skupina

Zájemce, kteří si chtějí rozšířit své základní statistické vzdělání.
Absolventi kurzu Základní kurz statistiky I či Statistika v lékařství I.
Všechny, kteří chtějí porozumět statistickému zpracování dat.
Vědečtí pracovníci, kteří si chtějí ujasnit své postupy.

Cíle kurzu

Rozšířit si své Naučit se základní postupy, jak správně předpřipravit svá data pro analýzu.
Naučit se vytvářet modely typu „Co se stane, když…“, tedy regresní metody pro nejrůznější situace.
Získat přehled v úlohách regresních, úlohách analýzy rozptylu a vícerozměrných metodách.
Naučit zpracovávat samostatně svá data v softwaru TIBCO Statistica pomocí odučených metod.

Osnova

Úvod

Základní informace o softwaru STATISTICA
Výukové zdroje pro software a možnosti nápovědy

Zpracování a příprava dat

Filtrování
Zpracování chybějících dat

Regresní analýza

Korelační analýza
Lineární regresní modely
Nelineární regresní modely
Logistická regrese
Analýza kovariance

Analýza rozptylu

Vícefaktorová ANOVA
ANOVA pro opakovaná měření
Vícerozměrná analýza rozptylu (MANOVA)

Úvod do vícerozměrných statistických metod

(podrobně probíráno v rámci kurzu Vícerozměrné statistické metody)

Úvod do časových řad

(podrobně probíráno v rámci kurzu Časové řady a predikce)

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows, kurz volně navazuje na Základní kurz statistiky I. Absolvování Základního kurzu statistiky I není podmínkou.

Předchozí kurzy

Vhodné je absolvovat následující kurz, nicméně to není podmínkou:

Základní kurz statistiky I.

Navazující kurzy

Navazujícími kurzy mohou být například kurzy, které rozšiřují a doplňují znalosti nabyté v tomto kurzu:

Vícerozměrné statistické metody,

Časové řady a predikce,

Analýza rozptylu,

Regresní analýza, Logistická, multinomická a ordinální regrese.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Specializované kurzy
Pro profesionály

Statistika ve společenských vědách

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Kvalitativní a ordinální data jsou součástí téměř každého kvantitativního výzkumu ve společenských vědách, kde data jsou vesměs získávána pomocí dotazníkových šetření nejrůznějšího typu. Kvalitativní data jsou zde typicky výsledkem dotazníkového šetření s “multiple choice” položkami, k ordinálním datům potom vedou např. šetření s Likertovými položkami. Ve své první části si dvoudenní kurz Statistika ve společenských vědách klade za cíl seznámit účastníky s klasickými metodami statistické analýzy takovýchto dat. Na programu budou nejprve metody popisné statistiky, jejichž použití je smysluplné v kontextu kvalitativních a ordinálních dat. Následně se zaměříme na metody umožňující vyhodnotit statistickou odlišnost mezi dvěma či více skupinami vzhledem ke kvalitativní, resp. ordinální odezvě. Například v kontextu pedagogického výzkumu budeme poté schopni vyhodnotit, zda existují průkazné rozdíly mezi výsledky žáků na školách různého typu (např. víceletá gymnázia a druhý stupeň základních škol). Dále se budeme zabývat metodami pro párová kvalitativní a ordinální data, které nám umožní vyhodnotit kupříkladu vliv intervence (změna učebního postupu, …) na odezvu (studijní výsledky).

Nevhodně či dokonce špatně sestavené dotazníkové šetření může vést ke zcela nepoužitelným datům, proto se budeme věnovat také položkové analýze dotazníkového šetření, která umožní posoudit míru vnitřní konzistence jednotlivých položek dotazníku.

Druhá hlavní část kurzu bude věnována zejména metodám statistické analýzy vícerozměrných dat. V kontextu kvantitativního výzkumu ve společenských vědách je často zjišťováno nemalé množství proměnných, kdy cílem je zjistit vazby mezi jednotlivými proměnnými současně. V první řadě se seznámíme s metodami, které umožní v přehledné formě reprezentovat či vizualizovat sesbíraná data. Půjde zejména o analýzu hlavních komponent, faktorovou analýzu, korespondenční analýzu, či vícerozměrné škálování. Soustředíme se také na vyhodnocení síly vztahu mezi dvěma skupinami proměnných pomocí kanonických korelací, které lze považovat za vícerozměrnou analogii klasického korelačního koeficientu. Nebude chybět také seznámení s metodami, pomocí nichž lze provádět klasifikaci jednotek (případů) na základě vícerozměrných dat. Půjde zejména o klasické metody diskriminační a shlukové analýzy a klasifikačních stromů.

Všechny metody budou ilustrovány na analýzách dat z různých společensko-vědních oborů pomocí modulů software TIBCO Statistica. Cílem je zejména vytvořit u účastníků kurzu dobrou představu o použití jednotlivých metod.

Cílová skupina

Z názvu kurzu je patrné, že kurz je ušit na míru potřebám výzkumníků z oblasti společenských věd.
Výzkumní pracovníci, kteří zpracovávají data z dotazníkových šetření.
Ti, kteří mají k dispozici vícerozměrná data a potřebují je statisticky zpracovávat.
Kurz je vhodný pro ty, kteří chtějí doplnit své teoretické znalosti o této metodologii.

Cíle kurzu

Vytvořit účastníkům dobrou představu o použití jednotlivých metod.
Naučit posluchače zpracovávat data z dotazníkových šetření a poznat, že je dotazník nevhodně sestaven.
Naučit hodnotit statistickou odlišnost mezi dvěma a více skupinami vzhledem ke kvalitativní odezvě.
Seznámit s vícerozměrnými statistickými metodami a jejím využitím.
Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Metody pro kvalitativní a ordinální data

Popisná statistika
Srovnání dvou či více skupin
Metody pro párová data

Položková analýza dotazníkových šetření

Cronbachovo alfa

Vícerozměrné statistické metody

Vizualizace
Analýza hlavních komponent
Faktorová analýza
Kanonické korelace
Korespondenční analýza
Mnohorozměrné škálování

Klasifikační metody

Diskriminační analýza
Shluková analýza
Klasifikační stromy

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Vhodné je absolvovat Základní kurz statistiky I.

Navazující kurzy

Účastníky mohou zajímat kurzy:

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Specializované kurzy
Pro profesionály

Statistika v lékařství I

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Tento dvoudenní kurz je určen všem těm, kteří ve své výzkumné či jiné práci s medicínským zaměřením potřebují provádět jednodušší statistické analýzy. Na konkrétních příkladech s lékařskou tématikou budou postupně probrány statistické metody, které bývají náplní jednosemestrálních přehledových kurzů biostatistiky na lékařských fakultách či vysokých školách přírodovědného zaměření. Zatímco v těchto kurzech je důraz často kladen na matematické detaily jednotlivých statistických postupů, hlavním cílem našeho kurzu je zaměřit se na získání dovednosti identifikovat pro konkrétní problém správnou statistickou metodu a po jejím provedení pomocí software TIBCO Statistica následně správně interpretovat její výsledky.

Cílová skupina

Kurz je svým zaměřením i praktickými příklady určen především pro ty, kteří pracují v medicínských zařízeních.
Začínající výzkumníky, kteří se chtějí dozvědět, jak analyzovat data.
Úplní začátečníci v oblasti zpracování dat.
Výzkumní pracovníci, kteří potřebují statisticky zpracovat výsledky svých studií či měření.
Výzkumní pracovníci, kteří si chtějí ověřit správnost svých postupů při zpracování dat.

Cíle kurzu

Seznámit se se základními statistickými metodami (přibližně v rozsahu jednosemestrálních přehledových kurzů biostatistiky).
Naučit se aplikovat správnou metodu na daná data.
Naučit se interpretovat výsledky statistických analýz.
Umět si samostatně zpracovat probírané analýzy v softwaru TIBCO Statistica.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Základní statistické pojmy, využití statistiky v medicíně

Popisná statistika pro kvalitativní data, jejich grafická prezentace

Popisná statistika vhodná při zkoumání závislosti mezi dvěma znaky (proměnnými)

Míry závislosti (korelace, ...)

Základní pojmy statistické inference

Odhad, test, chyba I. druhu, P-hodnota, síla, …

Porovnání dvou či více skupin vzhledem ke kvalitativnímu znaku

Srovnání proporcí
Chí-kvadrát test
McNemarův test, ...

Porovnání dvou či více skupin vzhledem ke kvantitativnímu znaku

Studentův t-test
Wilcoxonův test
Analýza rozptylu
Kruskalův-Wallisův test, …

Základy lineární regrese

Shrnutí

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows a základy ovládání softwaru STATISTICA.

Předchozí kurzy

Doporučujeme před kurzem absolvovat kurz Ovládání programu Statistica, aby se posluchač mohl plně soustředit na probíranou teorii.

Navazující kurzy

Nejvhodnějším kurzem je přímo navazující kurz

Statistika v lékařství II.

Dalšími kurzy, které mohou pomoci s analýzou v sektoru lékařství, jsou:

Analýza rozptylu
Analýza síly testu
Analýza přežití
Analýza kategoriálních dat
Logistická, ordinální a multinomická regrese

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Specializované kurzy
Pro profesionály

Statistika v lékařství II

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Kurz je pokračováním statistiky v lékařství. Je určen pro lékaře a další zájemce s podobným zaměřením, kteří potřebují ke své práci analýzu dat. Účastníci kurzu se seznámí s pokročilejšími statistickými technikami používanými v lékařství. V závěru kurzu je i úvod do metodologie, která je potřeba pro psaní odborných článků a využití nástrojů medicíny založené na důkazech.

Cílová skupina

Kurz je svým zaměřením i praktickými příklady určen především pro ty, kteří pracují v medicínských zařízeních.
Absolventi kurzu Statistika v lékařství I nebo Základního kurzu statistiky I.
Ti, kteří potřebují rozšířit své znalosti v oblasti statistického zpracování dat.
Výzkumní pracovníci, kteří si chtějí ověřit správnost svých postupů při zpracování dat.
Výzkumní pracovníci, kteří potřebují statisticky zpracovat výsledky svých studií či měření.

Cíle kurzu

Seznámit se s pokročilejšími statistickými metodami, které se používají v oblasti lékařství.
Naučit se aplikovat správnou metodu na daná data.
Naučit se interpretovat výsledky statistických analýz.
Umět si samostatně zpracovat probírané analýzy v softwaru TIBCO Statistica.

Osnova

Úvod
- Základní informace o softwaru TIBCO Statistica
- Výukové zdroje pro software a možnosti nápovědy
Základy pravděpodobnosti
Vícenásobná regrese
Zobecněné lineární modely
- Logistická regrese
- Poissonovská regrese
- Log-lineární modely
Ohodnocení binárních diagnostických procedur
- Bayesův vzorec
- Incidence, prevalence, senzitivita, specificita
- Pozitivní a negativní prediktivní hodnota
- ROC křivka
- Plocha pod křivkou (AUC).
Základy analýzy přežití
- Kaplanův-Meierův odhad funkce přežití
- Logrankový dvouvýběrový test
- Coxův model
- Parametrický AFT model
Základní typy statistických studií používaných v lékařství
- Průřezová studie
- Pozorovací studie
- Klinické pokusy, …
Úvod do metaanalýz
- Medicína založená na důkazech (evidence-based medicine)

Předpoklady účastníka

Znalosti v rozsahu kurzu Základní kurz statistiky I nebo Statistiky v lékařství I.

Předchozí kurzy

Pro tento kurz je potřeba mít znalosti v rozsahu kurzu Základní kurz statistiky I nebo Statistiky v lékařství I. Výhodné je také mít za sebou kurz Ovládání programu Statistica.

Navazující kurzy

Dalšími kurzy, které mohou pomoci s analýzou v sektoru lékařství a rozšíří nabyté znalosti, jsou:

Analýza rozptylu,

Analýza síly testu,

Analýza přežití,

Analýza kategoriálních dat,

Logistická, ordinální a multinomická regrese.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Specializované kurzy
Pro všechny

Základy statistiky pro průmysl

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Je známým faktem, že aplikace statistických metod v procesu výroby vede ke snížení variability měřených parametrů a zefektivnění výroby, a proto je tento kurz je pro Vás dobrým začátkem. Kurz je určen všem, kteří chtějí používat statistické metody v oblasti řízení kvality a průmyslu vůbec. Cílem dvoudenního kurzu je seznámit se od základu s filozofií statistického zpracování dat v průmyslu, důraz je také kladen na grafické možnosti systému TIBCO Statistica.

Cílová skupina

Úplní začátečníci
Všichni, kteří chtějí porozumět statistickému zpracování dat a to především ty z oblasti výroby
Pracovníci výroby, kteří potřebují pravidelně/nepravidelně vyhodnocovat svá data
Pracovníci, kteří potřebují najít vlivné faktory na sledovaný parametr (například z výroby)
Pracovníci, kteří potřebují zpracovávat obchodní data (najít závislosti, pokročilou vizualizaci apod.)
Pracovníci, kteří potřebují začít s analýzou dat.

Cíle kurzu

Seznámit s filozofií statistického zpracování dat v průmyslu.
Naučit se vhodně vizualizovat data.
Naučit se předpřipravit data pro analýzu.
Naučit se základní statistické metody.
Naučit se pracovat v softwaru TIBCO Statistica.

Osnova

Úvod
- Základní informace o softwaru TIBCO Statistica
- Výukové zdroje pro software a možnosti nápovědy
Základy obsluhy programu TIBCO Statistica
- Seznámení s prostředím TIBCO Statistica
- Načtení dat, různé typy výstupů, získání dat z databáze
- Možnosti grafických výstupů
Kontrola kvality dat
- Čištění dat
- Odlehlé hodnoty
Porozumění datům
- Box-Coxova transformace
- Paretova analýza
Úvod do analýzy dat
- Co je to statistická analýza dat
- Hlavní myšlenka statistické analýzy dat
Popisná statistika
- Typy rozdělení proměnných
- Číselné charakteristiky rozdělení proměnných, grafické znázornění
- Normální rozdělení a ověření normality dat
Testování hypotéz
- Úvod do testování hypotéz
- Jednotlivé kroky testování hypotéz, interpretace výsledků
Vybrané statistické metody
- Přehled některých základních testů a příklady jejich použití
- Korelační analýza
- Základní regulační diagramy
- Úvod do časových řad

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.

Předchozí kurzy

Tento kurz je úvodním kurzem do problematiky.

Navazující kurzy

Účastníky mohou zajímat kurzy:

Základy Lean Six Sigma,

Six Sigma Green Belt.

Pokročilé úlohy z průmyslového prostředí se dají řešit skrz data mining, tedy

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Pokud může automatizace postupů zjednodušit některé z procesů,pak je vhodné absolvovat kurz:

Data mining v praxi v prostředí Workspace (je samostatně nebo součástí kurzu Data mining (třídenní varianta)).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Data Mining
Pro všechny

Data Mining v praxi v prostředí Workspace

1

Zelený Pruh 95/97, Praha 4

5490,- Kč bez DPH

Tento jednodenní trénink je buď součástí kurzu Data mining (třídenní varianta) nebo ho lze absolvovat zvlášť jako jednodenní školení (tato varianta je vhodná především pro ty, kteří absolvovali kurz Data mining již dříve).

Prostředí pracovní plochy Workspace je uživatelské rozhraní, ve kterém je možné jednoduše a efektivně zpracovat a vizualizovat složitější pracovní postupy. I bez znalosti programovacích jazyků lze pomocí propojování uzlů (které představují jednotlivé analýzy a funkcionality, které již z programu Statistica znáte) naprogramovat kompletní a posléze automaticky spustitelnou analýzu. Také proto je toto prostředí primárně určeno pro data mining, využitelné je nicméně ve všech oblastech zpracování dat. Předpokládá se, že se toto uživatelské rozhraní díky svým vlastnostem stane postupem času primárním ovládacím prostředím programu.

Hlavní náplní kurzu jsou praktické ukázky a příklady úloh z oblasti data miningu či úloh, kde je možné výhodně využít funkcionality prostředí Workspace. Účastníci si budou během kurzu postupy sami zkoušet a tvořit spolu s lektorem na svém počítači.

Cílová skupina

Absolventi kurzu Data mining, jelikož tento kurz skvěle doplňuje a zužitkovává znalosti z tohoto kurzu.
Ti, kteří se chtějí seznámit a naučit se s prostředím Workspace.
Ti, kteří potřebují automatizovat své analytické pracovní postupy (a to bez nutnosti znát jakýkoli programovací jazyk).

Cíle kurzu

Vysvětlit výhody používání prostředí Workspace a motivovat posluchače k jeho budoucímu používání.
Naučit posluchače efektivně využívat prostředí Workspace.
Ukázat reálné příklady a typické úlohy, které lze prostředím Workspace velmi efektivně řešit.
Seznámit s dalšími možnostmi, jak lze posunout automatizaci analýz ještě dále.

Osnova

Úvod

Představení prostředí Workspace

Obsluha prostředí Workpace

Filozofie tohoto uživatelského rozhraní
Vlastnosti uzlů
Tématické skupiny uzlů
Rozdíl mezi skriptovanými a „novými“ uzly a využití této rozdílnosti v různých situacích
Speciální uzly

Praktické aplikace

Načítání dat z více datových zdrojů
Čištění a úprava dat
Workspace pro automatické reportování
Tvorba predikčních modelů
Porovnání kvality více modelů
Nasazení vytvořených modelů na nová data
Spouštění workspace ze Statistica Enterprise

Customizace a usnadnění práce

Přednastavené úlohy
Tvorba vlastní nabídky uzlů
Customizace vytvořených uzlů
Tvorba vlastních uzlů

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows. Kurz čerpá a navazuje na poznatky kurzu Data mining (dvoudenní varianta), proto jej doporučujeme před tímto kurzem absolvovat. Vhodné je také mít základní znalosti funkcionalit programu Statistica.

Předchozí kurzy

Kurz částečně čerpá ze znalostí kurzu

Data mining (dvoudenní varianta)

Výhodné, ale ne nutné je také absolvovat kurz:

Ovládání programu Statistica.

Navazující kurzy

Prostředí Workspace může být vnímáno a používáno jako nástroj pro programování. V případě, že potřebujete detailněji programovat své vlastní funkcionality a aplikace, můžeme doporučit kurz Statistica Visual Basic.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Data Mining
Pro všechny

Data Mining (dvoudenní varianta)

2

Zelený Pruh 95/97, Praha 4

13900,- Kč bez DPH

Tento dvoudenní kurz je určen osobám, které chtějí odhalit informace a znalosti ukryté v datech. Cílem tohoto kurzu není ukázat jen vhodné postupy, ale také způsob, jak co nejlépe prezentovat výsledky. V průběhu kurzu budou prezentovány nejrůznější techniky: korelační analýza, regresní analýza, časové řady, klasifikační stromy, neuronové sítě a další. Na závěr budou ukázány konkrétní příklady z oblasti vytěžování dat. V průběhu celého kurzu budou účastníci pracovat s modulem Statistica Data Miner.

Cílová skupina

Analytik, statistik či datový specialista, který potřebuje zpracovávat rychle velké objemy dat.
Zájemce o problematiku data miningu (dolování informací z dat).
Typickými posluchači mohou být analytici z oblasti bankovnictví, pojišťovnictví, ale také pokročilí analytici z oblasti průmyslu.
Ti, kteří se chtějí seznámit s modulem Data Miner v softwaru TIBCO Statistica.

Cíle kurzu

Seznámit se teoreticky, ale i prakticky s množstvím metod spadajících do oblasti data miningu.
Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
Naučit se pracovat v několika unikátních prostředích TIBCO Statistica určených přímo pro data mining.
Naučit se používat modul Data Miner.

Osnova

Úvod

Základní informace o softwaru Statistica
Výukové zdroje pro software a možnosti nápovědy

Úvod do vytěžování dat, produkt

Princip, možnosti, využití

Práce s recepty (wizardem)

Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
Výběr důležitých prediktorů pro požadovanou úlohu
Vytváření klasifikačních a regresních modelů
Vyhodnocení kvality vytvořeného modelů
Nasazení modelu v praxi

Klasifikační a regresní stromy

Princip, možnosti, využití
CART stromy
CHAID stromy
Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)
Generované stromy (Boosted Trees)
Náhodné lesy (Random Forests)

Lineární modely

Princip regrese
(Obecné) lineární modely
Zobecněné lineární modely
Zobecněné aditivní modely
MARSplines

Metody shlukování

K-průměrů (k-means)
Hierarchické a EM shlukování

Automatizované neuronové sítě

Princip umělých neuronových sítí, základní typy (MLP, RBF, Kohonenova síť)
Automatizovaný a vlastní návrh sítě

Metody strojového učení

Bayesův klasifikátor
SVM
k-NN klasifikátor

Analýza nezávislých komponent (ICA)

Text Mining

Účel, princip a zdroje text miningu
Vytvoření a práce s indexovým souborem
Asociační pravidla a sekvence

Nasazení modelů na reálná data z praxe

Kvalita získaných modelů

Korelační analýza
ROC křivka
Grafy zisku a navýšení (Gains/Lift cart)

Metody výběru vhodných příznaků

Sdružování rozsáhlých skupin hodnot příznaků (Binning)

Základy práce v pracovní ploše (Workspaces)

Práce s uzly
Využití přednastavených úloh (zejména pro klasifikaci a regresi)
Pro detailnější seznámení s tímto prostředím doporučujeme absolvovat třídenní verzi kurzu Data mining, který je sloučením tohoto dvoudenního kurzu a kurzu Data mining v praxi v prostředí Workspace

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows, doporučujeme před tímto kurzem absolvovat Základní kurz statistiky I.

Předchozí kurzy

Doporučujeme před tímto kurzem absolvovat kurz:

Základní kurz statistiky I.

Navazující kurzy

Spolu s dvoudenním kurzem Data mining doporučujeme absolvovat i kurz Data mining v praxi v prostředí Workspace.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Data Mining
Pro všechny

Data Mining (třídenní varianta)

3

Zelený Pruh 95/97, Praha 4

17900,- Kč bez DPH

Tento třídenní kurz je balíčkem kurzů Data mining (dvoudenní varianta) a Data mining v praxi v prostředí Workspace. V prvních dvou dnech se dozvíte o využití a pozadí data miningových metod, ve třetím dni se pak naučíte pracovat v prostředí pracovní plochy Workspace, která je nejvhodnějším uživatelským rozhraním pro zpracovávání dataminingových úloh. Nabyté znalosti Vám usnadní praktickou aplikaci data miningu na Vaše data a ukáží opravdovou sílu modulu Statistica Data Miner.

Cílová skupina

Analytik, statistik či datový specialista, který potřebuje zpracovávat rychle velké objemy dat.
Zájemce o problematiku data miningu (dolování informací z dat).
Typickými posluchači mohou být analytici z oblasti bankovnictví, pojišťovnictví, ale také pokročilí analytici z oblasti průmyslu.
Ti, kteří se chtějí seznámit s modulem Data Miner v softwaru TIBCO Statistica.

Cíle kurzu

Seznámit se teoreticky, ale i prakticky s množstvím metod spadajících do oblasti data miningu.
Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
Naučit se pracovat v několika unikátních prostředích TIBCO Statistica určených přímo pro data mining.
Naučit se používat modul Data Miner.
Naučit se používat prostředí Workspace,

Osnova

Pro kompletní program kurzu se prosím podívejte na stránky kurzů Data mining (dvoudenní varianta) a Data mining v praxi v prostředí workspace. Tento kurz je spojením obou kurzů.

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows, doporučujeme před tímto kurzem absolvovat Základní kurz statistiky I.

Předchozí kurzy

Doporučujeme před tímto kurzem absolvovat kurz:

Základní kurz statistiky I.

Výhodné je také absolvovat kurz:

Ovládání programu Statistica.

Navazující kurzy

Navázat můžete podle oboru a povahy problému, který zkoumáte, nějaký univerzální navazující kurz není k dispozici.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Data Mining
Pro profesionály

Klasifikační a regresní stromy

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Rozhodovací stromy jsou jednou z nejpoužívanějších technik data miningu. Kurz je určen těm, kteří se zajímají o klasifikaci dat (například credit scoring, kdy se na základě příznaků snažíme rozhodnout o zařazení vzorů do skupin) nebo se věnují regresním úlohám včetně predikcí časového vývoje. Kurz seznámí účastníky nejen s klasickými metodami, ale i s pokročilejšími stromovými strukturami jako jsou Boosting Trees nebo Random Forests. Součástí kurzu je i interaktivní tvorba vlastních stromů a jejich modifikace.

Cílová skupina

Statistici, datoví specialisté či analytici, kteří potřebují řešit úlohu predikce kategorií či predikci nějaké spojité veličiny na základě dalších atributů.
Klasifikační stromy jsou typickou metodou používanou v bankovnictví a pojišťovnictví.
Nejtypičtější úlohou je využití v oblasti credit scoring.

Cíle kurzu

Porozumět metodologii stromovitých algoritmů.
Dokázat vytvořit a interpretovat model pro predikci.
Dokázat si vyhodnotit, který model vybrat jako finální pro nasazení do procesu predikce.
Naučit se analyzovat data těmito metodami v softwaru TIBCO Statistica.
Seznámit se s prostředím Statistica Data Miner

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Příprava dat STATISTICA

Načtení, transformace, vzorkování, filtrace odlehlých hodnot, oprava chybějících údajů, atd.

Výběr důležitých prediktorů pro požadovanou úlohu

Sdružování rozsáhlých skupin hodnot příznaků (binning)

Klasifikační a regresní stromy

Vytváření, princip, možnosti, využití

Metody

Klasifikační a regresní stromy CART
CHAID
Generované stromy (Boosted Trees)
Náhodné lesy (Random Forests)
Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)

Vyhodnocení kvality vytvořeného modelu

Korelační analýza
ROC křivka
Grafy zisku a navýšení (Gains a Lift chart)

Nasazení modelu v praxi

Hierarchické shlukování a jeho souvislost s klasifikačními a regresními stromy

Základy práce v prostředí modulu Statistica Data Miner

Práce s recepty (wizardem)
Práce v rámci pracovní plochy (workspaces)
Využití přednastavených úloh
Implementace vlastních uzlů

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.

Navazující kurzy

Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:

Data mining v praxi v prostředí Workspace.

Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro klasifikační a regresní stromy, pak doporučujeme kurzy:

Neuronové sítě,

Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Data Mining
Pro profesionály

Neuronové sítě

2

Zelený Pruh 95/97, Praha 4

12900,- Kč bez DPH

Neuronové sítě patří mezi oblíbené moderní techniky, které umožňují nový a často i efektivnější přístup pro zpracování dat. Dvoudenní kurz umožňuje seznámení jak s teoretickými principy fungování neuronových sítí, tak s jejich praktickou aplikací prostřednictvím modulu STATISTICA Automatizované neuronové sítě. Kurz poskytne přehled o architektuře neuronových sítí a metodách učení. Postup, jak dosáhnout pomocí neuronových sítí co nejlepších výsledků, bude demonstrován při řešení praktických úloh.

Cílová skupina

Analytik, statistik či datový specialista, který potřebuje zpracovávat velké objemy dat.
Zájemce o problematiku neuronových sítí.
Ti, kteří mají v datech složité nelineární závislosti a chtějí i přes to tvořit modely pro predikci či klasifikaci.
Typickými posluchači mohou být analytici například z oblasti průmyslu, či specializovaných oblastí medicíny.
Ti, kteří se chtějí seznámit s modulem neuronových sítí v softwaru TIBCO Statistica.

Cíle kurzu

Seznámit se teoreticky, ale i prakticky s podstatou modelování pomocí neuronových sítí.
Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
Ukázat, jaké možnosti má v této oblasti software TIBCO Statistica.
Účastníci se také naučí pracovat v prostředích Receptů a částečně také v prostředí Workspace.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy

Práce s recepty (wizardem)

Princip, možnosti, využití

Práce s recepty (wizardem)

Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
Výběr důležitých prediktorů pro požadovanou úlohu
Vytváření klasifikačních a regresních modelů
Vyhodnocení kvality vytvořeného modelů
Nasazení modelu v praxi

Principy neuronových sítí

Neuron, model neuronu
Základní typy sítí (MLP, RBF Kohonenova)
Struktura neuronové sítě, princip učení, reprezentace znalostí

Práce s neuronovými sítěmi

Rozdělování dat na trénovací, validační a testovací množiny, bootstrapping, křížová validace
Nastavení parametrů sítí (počet vrstev, neuronů, typy neuronů, post-synaptické funkce, aktivační funkce, algoritmy učení – backpropagation, problém lokálního minima, heuristiky a další)
Automatizovaný a vlastní návrh sítě

Využití neuronových sítí

Klasifikace
Regrese
Analýza časových řad
Shluková analýza pomocí Kohonenovy neuronové sítě (SOM)

Metody výběru vhodných příznaků

Sdružování rozsáhlých skupin hodnot příznaků (binning)

Vyhodnocení kvality vytvořeného modelu

Korelační analýza
ROC křivka
grafy zisku a navýšení (Gains a Lift chart)

Nasazení modelu v praxi

Práce v prostředí modulu STATISTICA Data Miner

Práce v rámci pracovní plochy (workspaces)
Využití přednastavených úloh
Implementace vlastních uzlů

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows

Předchozí kurzy

Není nutné absolvovat před tímto kurzem jiné kurzy, nicméně znalost základů statistického uvažování je vhodná.

Navazující kurzy

Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:

Data mining v praxi v prostředí Workspace.

Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro neuronové sítě, pak doporučujeme kurzy:

Klasifikační a regresní stromy,

Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

10 / 04 / 2018
Data Mining
Pro profesionály

Text Mining

1

Zelený Pruh 95/97, Praha 4

7900,- Kč bez DPH

Tento jednodenní kurz je určen těm, kteří se zajímají o možnosti získávání a vyhodnocování informací z textových dokumentů, nejčastěji z webových zdrojů, ale i ze souboru textových dokumentů nebo různých databází. Cílem kurzu je ukázat možnosti jak pracovat s vágními textovými informacemi a jak z nich získat užitečnou informaci pro další zpracování a rozhodování. Využití text miningu lze spatřovat například v oblasti sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cílová skupina

Analytici, datoví specialisté či statistici, kteří chtějí využít informace v datech ve formě nestrukturovaného textu.
Text mining se využívá v oblastech sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cíle kurzu

Ukázat, jak a čím může být metodologie text miningu přínosná.
Pochopit, jak může v úlohách text miningu přispět software TIBCO Statistica.
Ukázat si, jaké všechny možnosti a nastavení lze použít.
Vysvětlit si pojmy, které se běžně v souvislosti s text miningem vyskytují
Naučit se, jak využít získanou informaci ve formě indexového souboru pro další analýzy.

Osnova

Úvod

Základní informace o softwaru TIBCO Statistica
Výukové zdroje pro software a možnosti nápovědy
Seznámení s prostředím TIBCO Statistica
Načtení dat, různé typy výstupů, získání dat z databáze
Možnosti grafických výstupů

Účel, princip a zdroje text miningu

Nastavení podmínek pro prohledávání a nastavení filtrů

Výběr jazyka, zastoupení slov,…
Nastavení frází, povolených, zakázaných slov, synonym
Nastavení délky slov, max. počet souhlásek, povolených znaků, atd.

Vytvoření a práce s indexovým souborem a frekvenční maticí

Výběr významných příznaků (prediktorů) pro klasifikační úlohu

Klasifikace

Klasifikační stromy
Metody strojového učení
Neuronové sítě

Shluková analýza nad získanými daty

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows.

Navazující kurzy

Logickým navázáním na kurz je detailní vysvětlení metodologie, jak používat výsledky z textminingové analýzy.

Vhodnými tedy mohou být kurzy:

Data Mining (dvoudenní nebo třídenní varianta)
Neuronové sítě
Klasifikační a regresní stromy

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Zavřít

Pořiďte si licence nebo si zvolte vyhovující formu podpory

Licence
a podpora

Popis typů licencí

Jednotlivé produkty (analytické balíčky Professional, Expert - Quality Control, Expert - Data Science, Enterprise) lze kombinovat s určitým typem licence. Licence se od sebe odlišují typem instalace, počtem přistupujících uživatelů a specifickými funkcemi (možnosti reportování, přístup přes web apod.). Cílem následujícího textu je představit si jednotlivé typy licencí, které lze pořídit.

Jednouživatelská (desktopová) licence – Named User license

Umožňuje instalovat software na konkrétní počítač a na něm ho následně provozovat. Licence je vázaná na uživatele, nikoliv na pracovní stanici. V případě potřeby změny počítače (poruchy, novější PC) se provede „odregistrace“ licence a následně je možné software nainstalovat na jiný PC.

Pro koho je určena:

Tato licence se využívá celosvětově na výzkumních pracovištích, v laboratořích, malých firmách, apod. Je využitelná všude tam, kde je koncový uživatel pouze jeden. Velmi oblíbená je na akademické půdě pro jednotlivé studenty / pedagogy / výzkumní pracovníky.

Dostupná pro produkty:

Professional
Expert – Quality Control
Expert - Data Science
Enterprise
Speciální akademické produkty

Dostupné časové provedení:

Trvalá licencie (Perpetual) – bez časového omezení s možností dobrovolné technické podpory
Časová licence (Subscription) – roční licence zahrnující technickou podporu po dobu platnosti licence

Výhody:

Velmi jednoduchá instalace
Nižší pořizovací náklady

Plovoucí síťová licence – Concurrent User

Smyslem síťové licence je flexibilní využití softwaru Statistica pro široké spektrum pracovních stanic v rámci instituce. Software lze nainstalovat na libovolný počet pracovních stanic, které jsou spojeny lokální sítí. Rozhoduje počet současně přistupujících uživatelů, který je dám počtem zakoupených licencí (licence „plavou“ mezi pracovními stanicemi dle aktuálního využití software uživateli). Prakticky je tedy počet uživatelů, kteří při této licenci mají možnost se softwarem pracovat, neomezený.

Pro koho je určena

Tato licence je využívaná v společnostech z nejrůznějších oblastí lidské činnosti, kde existuje vícero uživatelů – bankonvictví, průmysl, výzkum, marketing, utility, atd. Také je ve velké míře využívaná ve výzkumních institucích napříč výzkumnými týmy a odděleními, na univerzitách v rámci kateder, nebo celých fakult. Velmi oblíbené je využití v učebnách univerzít, kde tento typ licence umožňuje komfortní a pohodlnou administraci.
Při tomto typu licence lze kombinovat jednotlivé produkty softwaru a zakoupit tak konfiguraci přesně podle toho, jak bude program využíván. Lze tedy optimalizovat náklady na licence podle potřeb a počtu uživatelů.

Dostupná pro produkty:

Expert – Quality Control
Expert - Data Science
Enterprise
Speciální akademické produkty

Dostupné časové provedení:

Trvalá licencie (Perpetual) – bez časového omezení s možností dobrovolné technické podpory
Časová licence (Subscription) – roční licence zahrnující technickou podporu po dobu platnosti licence

Výhody:

Velmi jednoduchá instalace
Komfortní a pohodlná administrace
Využití neomezeným počtem uživatelů v rámci LAN
Vhodná pro optimalizaci nákladů

Technické detaily licence

Tento typ licence sestává z instalace síťového Statistica serveru, což může být i obyčejný průměrný počítač. Tento licenční Statistica server v sobě obsahuje ověřování licencí licenčním manažerem (FLEXlm ) a také soubory nutné pro spuštění softwaru. Plovoucí licence umožňuje následující způsob spouštění aplikace Statistica:

Ze Statistica serveru je z uvedeného sdíleného adresáře nainstalován libovolný počet klientských stanic. Maximální počet současně přistupujících uživatelů je nastaven v počtu zakoupených licencí (viz varianty řešení). Na klientský počítač se defaultně nainstaluje kompletní instalace softwaru, tento typ instalace je nazýván jako BNET a umožnuje dočasné odpojení klientského počítače od licenčního serveru. Licenci je možné vypůjčit až na 30 dní. Uživatel tedy může mít funkční software Statistica např. na notebooku během pracovní cesty.
Síťová plovoucí instalace volitelně umožňuje také variantu, kdy se ze serveru nainstaluje pouze minimum souborů nezbytných pro spojení se Statistica serverem (varianta CNET), ze kterého jsou po úspěšném ověření a přiřazení volné licence stažené všechny knihovny a spustitelné soubory programu (při samotném spuštění cca. 50 MB, celkem až 291MB)). Na klientský počítač jsou tedy knihovny Statistica staženy až pouze v případě, kdy je nutné je využít. Tato instalace umožňuje velmi snadnou správu, neboť všechny upgrady jsou instalovány pouze na „centrální“ počítač – server.

V obou síťových verzích probíhají výpočty na klientských stanicích. Klientskou stanicí však může být i výkonný server ve společnosti. Způsob práce ilustruje následující schéma. Schéma ilustruje i možnost odpojení počítače od vnitřní sítě a využívání řešení mimo síť (na služební cestě, prezentací na konferenci atd.).

Zavřít

Petra má ráda cestování a dobré jídlo. Kromě toho je fanda kontingenčních tabulek.

Instalace
a implementace

Zavřít

Petra má ráda cestování a dobré jídlo. Kromě toho je fanda kontingenčních tabulek.

Školení
a podpora uživatelů

Zavřít

Petra má ráda cestování a dobré jídlo. Kromě toho je fanda kontingenčních tabulek.

Konzultace
a odborná

Zavřít

Snadná a intuitivní tranformace dat

Alpine Data

Zavřít

Flexibilní BI k zabudování do aplikací

TIBCO JasperSoft

Zavřít

Intuitivní BI nástroj s pokročilou analytikou

TIBCO Spotfire

Zavřít

Komplexní analytický nástroj pro správu a zpracovávání dat ve všech oblastech lidské činnosti

TIBCO Statistica™

O Statistice
Produkty
Funkce
Ke stažení

TIBCO Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších. Analytická platforma Statistica umožní organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do provozu.

Produkty (balíčky) TIBCO Statistica

Produkty jsou balíčky funkcionalit a rozšíření základního nástroje. Většinu analytických metod najdete ve verzi Professional. Specifické rozšíření jsou potom spojena s balíčky určenými na konkrétní aplikaci. Čtěte dále pod záložkou produkty.

Každý balíček může být dodán v různých licenčních formách. Více na téma licence.

Funkce	Professional	Expert Quality Control	Expert Data Science	Enterprise
Základní statistiky a vizualizace
Pokročilá statistika
Průmyslová statistika
Reportovací tabulky
Vizualizační panely
Vícerozměrné statistiky
Porovnávací metody	*	*	*	*
Analýza přežití	*	*	*	*
ETL
Modul tvorby pravidel
PI konektor
Variace
Testování hypotéz
Data Mining
Vývojové nástroje
Optimalizace procesů
Text Mining
In-Database Analytics				**

* Tyto moduly můžou být dodatečně licencovány „al carte“
** In-Database Analytics jsou doplňkem Statistica Serveru.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Produkty

Professional
Je základní verzí programu Statistica. Nabízí celé spektrum klasických statistických metod včetně reportingu a vizualizace. Pomocí intuitivního rozhraní založeného na standartních windows ikonách mohou být analýzy jasně strukturovány, snadno automatizovány a znovu použity. Díky přívětivému uživatelskému rozhraní je produkt vhodný pro příležitostné analytiky dat. Statistica Professional je vhodným nástrojem pro každého uživatele, který chce provádět základní nebo pokročilé analýzy a vizualizace na své lokální stanici.

Expert – Quality Control (DOPORUČUJEME)
Tento produkt obsahuje všechny funkce verze Statistica Professional. Navíc jsou v nabídce speciální možnosti ETL(extract, transform a load) a specifické přístupy k datům. Díky funkci Tvorba pravidel mohou být analýzy dat automatizovány na přehledném dashboardu, kde můžete sledovat i upravovat definovaná pravidla v reálném čase. Tento produkt je vhodný pro analýzu dat ve výrobních podnicích a v technických procesech. Je vhodným základním kamenem pro naplnění iniciativy v rámci zavedení prvků INDUSTRY 4.0 (více k tématu zde) a to v jakémkoli odvětví, kde chcete získat informace prostřednictvím vizualizací a analýz založených na heterogenních datových zdrojích a požadavcích založených na pravidlech. K dispozici jako stolní, síťová a serverová verze, díky které může být Statistica Expert – Data Science rozšířena na celopodnikový analytický systém.

Expert - Data Science
Pokud jde o pokročilou analytiku, což znamená zejména výpočet prediktivních modelů pro různá strategická rozhodnutí založená na datových údajích nebo průzkumu velkých dat, je jasnou volbou Statistica Expert - Data Science. Nabízí kromě klasických metod statistické analýzy všechny důležité metody předběžné analýzy od přípravy dat, modelování až po definované nebo parametrizovatelné predikční modely. Zkušený vědecký pracovník využívá intuitivní rozhraní Statistica k vytváření a implementaci komplexních procesů analýzy. Statistica Expert - Data Science je dostupná v desktopových, síťových a serverových verzích a může být nasazena jako celopodnikový analytický systém.

Statistica Enterprise
Funkce verze Statistica Enterprise přesahují rámec Statistica Expert – Quality Control a Statistica Expert - Data Science. Jsou nabízeny metody pro optimalizaci procesů a licence umožňuje importovaní či exportování modelů do jiných formátů, aby mohly být začleněny do aplikací třetích stran a použity nezávisle na Statistice. Verze Statistica Enterprise je k dispozici na koncových stanicích, v síťové licenci a v serverových verzích a může být nasazen jako celopodnikový analytický systém. Serverová verze umožňuje kompletní automatizaci procesů a správu všech analytických procesů v podniku, včetně přístupu k datům, analýzám, přehledům a distribucím informací.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Funkce

FUNKCE Základní statistiky a vizualizace

Data, data, data - žádná společnost bez nich nemůže fungovat. Pro jejich využití v rozhodovacích procesech je zapotřebí vhodných nástrojů pro analýzu. To platí nejen pro projekty s "big daty", ale také pro jakékoli další data z databázových či transakčních systémů nebo dokonce z excelů nebo z papíru. Pro splnění těchto požadavků nabízí Statistica komplexní softwarový balík základních statistických operací a vhodných grafických výstupů. To vše doplněno intuitivním ovládáním, všestranností a příjemným pracovním prostředím podobným právě nástroji MS Excel.

Nativní schopnosti nástroje STATISTICA

Velmi přesné výpočty
Různé zobrazovací formáty pro data podle interpretace obsahu
Automatické značení významných výsledků
Zpracování výstupů formou závěrečné zprávy
- Jednoduché formátování výstupu
- Možnost vložit grafy a tabulky do sestav
- Podpora formátů HTML, Word, RTF a PDF
Nástroje pro přípravu dat
- Detekce chybějících dat a dat mimo stanovený rozsah
- Detekce odlehlých a extrémních hodnot
- Překodování a tvorba nových proměnných
- Úprava řádků a sloupců tabulky
- Zpracování chybějících dat/duplicitních případů
- Funkce (matematické, statistické, operátory a mnoho dalších) pro tvorbu nových proměnných a získání dalších informací z proměnných stávajících
- Přeskupování a seskupování proměnných
- Standandardizace a normalizace proměnných
- Slučování tabulek
- Filtrování
- Transpozice, třídění dat
- Kombinace různých zdrojových datových tabulek, práce s různými typy proměnných
- Výběr dílčích oblastí, výběr případů
- Generování náhodných čísel
- Výkonná a rychlá transformace dat (načtení, modifikace, uložení)
Snadné použití výsledků tabulek jako vstup pro další analýzu
Analýzy a hodnocení platné pro celé tabulky nebo označené bloky

Popisná statistika, strukturovaná statistika, průzkumná analýza dat

Popisné statistiky
- Střední, modální hodnota
- Kvartil, uživatelsky definované percentily
- Průměrná, směrodatná odchylka, rozptyl
- Šikmost a špičatost (s příslušnými standardními odchylkami)
- Intervaly spolehlivosti pro střední hodnotu
- Intervaly spolehlivosti pro průměr
- Harmonický průměr, geometrický průměr
- Speciální popisné statistiky a diagnostické charakteristiky
- Minimum, Maximum, Součty
- Rozpětí, vzdálenost kvartilů
Čištění dat
- Oříznutí dat (trimmed agent)
- Zprostředkování dat (winsorized agent)
- Grubbsův test pro odlehlé hodnoty
Ověření normality dat podle:
- Kolmogorov-Smirnova testu
- Lillieforsovy zkoušky
- Shapiro-Wilkova testu normality
Analýzy podle skupin
- Seskupení dat podle kategorických proměnných
- Kategorizace spojitých proměnných
- Překódování proměnných
- Hierarchická struktura a analýza jednotlivých podskupin
Průzkumná analýza dat v různých grafických výstupech
- Box-plot diagramy
- Histogramy, dvourozměrné histogramy (3D nebo v kategoriích)
- 2D a 3D bodové grafy
- Distribuční grafy (jednostranné, upravené dle trendu)
- Q-Q grafy, P-P grafy

…další metody zobrazení dat

Korelace

Míry asociace
- Pearsonův korelační koeficient
- Spearmanův korelační koeficient
- Kendallovo Tau (b, c)
- Gama
- Tetrachorický koeficient korelace
- Pí
- Cramerovo V
- Koeficient podmíněnosti C
- Sommerovo d
- Koeficient nejistoty (uncertainty coefficient)
- Parciální korelace
- Autokorelace
Výpočet korelačních matic
- Vyloučení chybějících hodnot (v párech nebo případ po případu)
Grafické znázornění výsledků
- Bodový graf s intervaly spolehlivosti
- Maticové bodové grafy
- Plošné grafy
- Dvourozměrné 3D histogramy
- Pravděpodobnostní grafy
- …další metody zobrazení dat
Diagnostika a čištění odlehlých hodnot

Interaktivní výpočet pravděpodobnosti

rozsáhlý výběr distribucí
beta
binomický
Cauchy
Chi-kvadrant
exponenciální
extrémní hodnota
F
gama
hypergeometrické
Laplace
lognormální
logistické
Pareto
Poissono
Rayleightovo
T (Student)
Weibullovo
Z (Normální)
Výpočet parametrů pro korelaci Pearson-Produkt-Moment
Six Sigma výpočty
Výpočet DPMO

t-testy (testy rozdílu mezi skupinami)

nezávislé vzorky podle skupin
nezávislé vzorky podle proměnných
(spárované) vzorky
jediný vzorek
Hotelové hosté T²
Různé možnosti v dialogovém okně výsledků:
oddělený odhad odchylky
interval spolehlivosti
Leveneův test pro homogenitu rozptylu
Test Brown & Forsythe
Typické grafické výstupy analýzy
Box ploty
Histogramy v kategoriích
Normální distribuční plochy (v kategoriích, jednostranné, upravené trendy)
Scatter-plot v kategoriích
…další metody zobrazení dat

Tabulky rozptylů, kontingenční tabulky, tabulky se shluky, analýza více odpovědí

Určete okrajové frekvence a poměry kategorických nebo dichotomických proměnných
Možnosti pro zpracování chybějících hodnot (chybějící údaje)
Párové zpracování proměnných
Kategorizace případů s vlastními podmínkami výběru
je možné individuální formátování výsledkových tabulek
Styl rozpadu nebo hierarchické uspořádání faktorů
Řádky, sloupce nebo celkové procenta v kontingenčních tabulkách (křížové tabulky)
Zvýraznění určitých kategorií
kumulativní, relativní, logit- a probit-transformované frekvence
Očekávaná hodnota při normálním rozdělení
Kolmogorov-Smirnov test
Lillieforsova zkouška
Shapiro-Wilkův testu
Reziduální rozptyl
Statistické testy pro kontingenční tabulky (křížové tabulky)
Pearson r
Maximální pravděpodobnost
Yatesův korigovaný Chi-kvadrant
McNemarův Chi-kvadrant
Fisherův přesný test (jednostranný a oboustranný)
Pí
Cramérsovo V a C
Tetrachorické r
Kendallův Tau (b, c)
gama
Spearmanův R
Sommersovo D
koeficient nejistoty
Typické grafické výstupy analýzy
Interaktivní plot diagramy pro různé frekvence
3D histogramy, histogramy v kategoriích
Normální distribuční plochy (v kategoriích, jednostranné, upravené trendy)
Box-plot diagramy

Vícenásobné regrese

modely lineární regrese
jednoduché, vícenásobné (i pro seskupená data)
postupně (vpřed, vzad, v blocích)
Modely s nebo bez konstant
Modely regrese „Ridge“
vážené nejmenší čtverce
Vlastnosti regresních tabulek
Standardní chyba pro B, beta a konstantu
R², opravený R²
ANOVA tabulka
Matrice s (částečnými) korelačními koeficienty
Korelace a kovariance regresních koeficientů
Sweep matice (inverzní matice)
Durbin-Watsonova statistika
Mahalnobiho a Cookova vzdálenost
Rezidua pro odstranění pozorování
Intervaly spolehlivosti pro prognózované hodnoty
dvoustupňová regrese nejmenších čtverců (makro)
Transformace Box-Tidwell (makro)
Typické grafické výstupy analýzy
Rozdělení zbytku, vykreslení odlehlé hodnoty
Standartní diagramy pravděpodobnost
pozorované hodnoty, prognózované hodnoty
Grafy částečné korelace
Iconplots

Neparametrické statistiky

Wolf Forestův test
Mann-Whitneyův U-test (s přesnými pravděpodobnostmi namísto Z-aproximace u malých vzorků)
Kolmogorov-Smirnovův test
Wilcoxonův test pro související vzorky
Kruskal-Wallisova hodnocení a analýza odchylek
Median test
Friedmanova hodnostní analýza rozptylu
Cochranův Q-test
McNemarův zkouška
Kendallův koordinační koeficient
Kendallův Tau (b, c)
Spearmanův R
Fisherův přesný test
Chi-kvadrát
V-square statistika
Pí
gama
Sommersovo d
nahodilost
Typické grafické výstupy analýzy
3D histogramy, histogramy v kategoriích
Matrix-scatter-plots diagramy
Box-plot diagramy

Rozdělení pravděpodobnosti

normální rozdělení
rovnoměrné rozdělení
exponenciální
gama distribucedistribuce logaritmická normální
Chi-kvadrant čtverce
Weibullovo
binomické
Poissonovo
Geometrické rozložení
Alternativní rozdělení
Chi-kvadrát test
Kolmogorov-Smirnovův test jednoho vzorku
Lillieforsovo zkouška
Shapiro-Wilkův testu
Funkce hustoty a distribuce
simulační metody
Monte Carlo
Latinské vzorkování Hypercube (LHS)
Způsoby Iman-Conovera
LHS s Iman Conoverovou metodou
Typické grafické výstupy analýzy
Plot P-P, plot Q-Q
Box plot
Histogramy (s úpravou, kumulativní)
Empirická distribuční funkce

FUNKCE Pokročilá statistika

Obecné lineární modely (OLM)

Předdefinované standardní modely
jednorozměrná, multivariační analýzy rozptylu (ANOVA / MANOVA)
ANOVA s hlavními a interaktivními efekty
pevné a / nebo náhodné faktory (smíšený model ANOVA)
Hierarchická ANOVA
ANOVA s opakovaným měřením (korekce podle Greenhouse-Geisser, Huynh-Feldt)
Vícenásobné regrese s hlavními a interakčními účinky
Polynomická regrese
Účinnost regresní oblasti
Regrese oddělených modelů
Kovarianční analýza s hlavními účinky
Model oddělených regresí
Kovarianční analýza s hlavními a interakčními účinky
Uživatelské modely
ANOVA / MANOVA
Další regresní metody
Další kovariační analýzy
integrovaný asistent pro vhodnou volbu modelu
Editor syntaxe analýzy (volitelně také syntaxe SAS)
Doplňkové zkoušky a modelové zkoušky
LACK-OF-FIT test
Post-hoc testy, analýza kontrastu, srovnání s kontrolní skupinou (Dunnettův test)
Multivariační testy (Wilks, Pillai's, Hotelling's, Roy's)
Testy na vlastní hypotézy / chybové termíny
Test homogenity rozptylu (Bartlettův Chi², Levenův test)
podrobné zbytkové statistiky
Graf hlavních a interakčních efektů
Rozptylové grafy pro zbytky, předpovědi hodnot
Histogramy a normální rozdělení
Box-plot diagramy
aplikace modelu
Integrovaný výpočet optimalizace s profilem nárazu
Výpočet odhadovaných hodnot pro nové případy
Výsledek předpovědi s exportem do textu

Obecné regresní modely (ORM)

Předdefinované standardní modely
jednorozměrné, multivariační analýzy rozptylu (ANOVA / MANOVA)
ANOVA s hlavními a interaktivními efekty
Více regrese s hlavními a interakčními účinky
Polynomická regrese
Účinnost regrese oblasti
Regrese povrchu směsi
Kovariační analýza s hlavními účinky
Kovariační analýza s hlavními a interakčními účinky
Uživatelské modely
různé ANOVA / MANOVA
různé regresní metody
různé kovarianční analýzy
Automatická konstrukce modelu
Stepwise forward / backward výběr prediktorů
Nejlepší podskupiny Výběr prediktorů
Volitelné nahrávání s předpovědní funkcí
integrovaný asistent pro vhodnou volbu modelu
Editor syntaxe analýzy (volitelně také syntaxe SAS)
Doplňkové zkoušky a modelové zkoušky
LACK-OF-FIT Test
Post-hoc testy, analýza kontrastu, srovnání s kontrolní skupinou (Dunnettův test)
Multivariační testy (Wilks, Pillai's, Hotelling's, Roy's)
Testy na vlastní hypotézy / chybové termíny
Test homogenity rozptylu (Bartlettův Chi², Levenův test)
podrobné zbytkové statistiky
Graf hlavních a interakčních efektů
Rozptylové grafy pro zbytky, předpovědi hodnot
Histogramy a normální rozdělení
Box-plot diagramy
aplikace modelu
Integrovaný výpočet optimalizace s profilem nárazu
Výpočet odhadovaných hodnot pro nové případy
Výsledek bádaní možno exportovat jako text

FUNKCE Průmyslová statistika

Statistica kombinuje standardní statistické techniky a efektivní grafiku a snadnou obsluhu. Různé "grafy kontroly kvality" umožňují jasně ilustrovat vývoj důležitých vlastností procesu měření kvality. "Analýza procesů" nabízí rozsáhlé metody pro kontrolu statistických procesů a analýzu měřicích systémů. A modul "Experiment Planning" vás pomůže při tvorbě a analýze experimentálních návrhů. Navíc "Analýza výkonu" vám umožňuje zjistit, jaké velikosti vzorku potřebujete, abyste získali smysluplné výsledky před reálným provedením.

Grafy kontroly kvality (QC grafy)
- Řídicí diagramy testu měření
- X-transverse & R (mapa osy X pro průměry, mapa R pro disperzi procesu)
- X-Quer & S (mapa osy X pro průměry, S-mapa pro rozptyl procesu)
- X & MR (X-karta pro jednotlivé hodnoty, karta pohyblivého rozsahu pro rozptyl procesu)
- MA X-Transverse & R-Map (klouzavý průměr: klouzavý průměr)
- Karta MA X-Cross & S
- EWMA X-Quer & R-Map (exponenciálně vážený klouzavý průměr)
- Karta EWMA X-Quer & S
- Jednotlivé hodnoty karty CUSUM (kumulativní souhrnná kontrolní karta)
Kontrolní tabulky pro zkoušku hodnocení
- C-karta (počet defektů, distribuce Poissonu)
- U-karta (míra deficitu, distribuce Poissonu)
- Karta Np (počet odmítnutí, binomická distribuce)
- P-karta (míra odmítnutí, binomická distribuce)
Pareto
Multivariační grafy řízení kvality
- Hotelling T² karta pro jednotlivé nebo průměrné hodnoty
- Jednoduché nebo průměrné skóre MEWMA (multivariační exponenciálně vážený pohyblivý průměr)
- Multivariační CUSUM karta
- Karty Multiple Stream X / MR (víceúčelová jednosměrná karta s vícenásobným proudem a vícenásobná přenosová rychlost)
- Karty Multi-Stream X-Quer & R (víceúrovňová mapa pro ukázkové prostředky a mapu rozmezí více proudů)
- Karta Multi-Stream X-Quer & S (karta s více streamy pro vzorkovací prostředky a karta standardní odchylky pro více streamů)

Analýza procesů a měřících systémů (SPC, MSA)

Analýza způsobilosti procesu a výkonnosti procesu
Analýza způsobilosti procesu a toleranční intervaly, jednotlivé údaje nebo souhrnné údaje
Procesní způsobilost DIN ISO 21747 (modely distribučního času)
Schopnost procesu pro toleranci polohy (dvourozměrná procesní schopnost)
Analýza schopnosti testu počítání (binomická a Poissonova distribuce)
Analýza měřicího systému (MSA)
Schopnost měřicího zařízení s a bez vlivu obsluhy (MSA I / III)
Opakovatelnost a srovnávací přesnost měření (MSA II, opakovatelnost a reprodukovatelnost měřidla, R & R)
Linearita měřicích přístrojů (lineární linearita)
Analýza přiřazovacího měřicího systému (analytická metoda)
Přizpůsobivá analýza kontroly
MSA přiřazovací data s referencí a bez odkazu (účinnost měřicího systému)
Analýza prostojů
Odhadovaná životnost s distribucí Weibull
Cenzurované a necenzurované prostoje
Určení doby bez poruchy (parametr polohy)
Weibullovy sítě
Diagramy příčin a účinků (Ishikawa, Fishbone)

Reportovací tabulky

Reportovací tabulky

Vizualizační panely

Vytvořte smysluplné panely, které vám umožní vizualizovat a shromažďovat data. Funkce drill-down ve vizualizačních panelech umožňuje vyhledávat kontexty na různých úrovních agregace a interpolovat chybějící data.

FUNKCE Vícerozměrné statistiky

Porovnávací metody

Nejen v klinických studiích ale i v jiných oblastech, jako je například průmyslová výroba, nebo služby vyžadují způsoby, jak ověřit nebo porovnat jednotlivé výsledky a následně vyhodnotit jak zafungovala například úsporná opatření. V praxi se často používají nevhodné statistické metody, jako jsou jednoduché korelační analýzy nebo průměrná srovnání.
Porovnávací metody v nástroji Statistica kombinuje současné výpočty a vizualizační standardy porovnání metod měření. Zahrnuty jsou:

Regrese na Passing-Bablog
Deming regrese (jednoduchá, vážená, IRGDR)
Bland-Altmanovy diagramy
Zvláštní hodnocení, jako jsou chybové mřížky a výpočty předsudků.
Z porovnání můžete stisknutím tlačítka vygenerovat sofistikovanou statistiku s grafickými a číselnými výstupy!

FUNKCE Analýza přežití

Společnosti ve farmaceutickém průmyslu používají při dlouhodobém vyhodnocení statistické metody pro výpočet doby trvanlivosti výrobku nebo či opakovaného zkoušení účinné složky podle přísných specifikací evropských regulačních orgánů. Pravidlo Q1E Mezinárodní konference o harmonizaci (ICH) obsahuje konkrétní nařízení pro statistické zpracování údajů o stabilitě, jejichž realizace vyžaduje hlubokou znalost regresní a kovarianční analýzy.

STATISTICA Add-on Analýza přežití umožňuje automatizovat výpočet trvanlivosti (skladovatelnost) a výkon účinné složky (přezkoušení období) po Q1E preferencí:

Stanovení pojmu pro jednotlivé nebo vícenásobné dávky
Analýza Covariance pro sdružování údajů
Automatické určování modelu statistickým testem na stejném vzorku a stejným zachycením funkce stability více dávek
Přepínání mezi německým a anglickým jazykem pro vstupní masky a výstupní výsledek
Automatické generování sestavy ve formátu pdf
Pomocí modulu analýza přežití můžete vyhodnocovat studie stability a na stisknutí tlačítka vytvářet archivovatelné výstupní dokumenty!

FUNKCE ETL

Nástroj Statistica Extract, Transform a Load ( ETL) extrahuje, transformuje a načítá data z různých zdrojů do tabulky statistik. Heterogenní zdroje dat jsou standardizovány, koordinovány a přímo přístupné další analýze.
Například data z jedné minuty z jedné databáze mohou být přiřazena k hodinovým datům jiné databáze takovým způsobem, že příslušné hodnoty měření nebo charakteristiky z obou zdrojů dat mohou být následně analyzovány dohromady. V tomto případě mohou být údaje v minutách statisticky shromažďovány různými způsoby - například sumarizací nebo zprůměrování. Další pokyny pro zpracování, jako je rozsah hodnot nebo časové filtry, které je třeba vzít v úvahu, lze pohodlně definovat pomocí uživatelsky přívětivého menu. To umožňuje flexibilní zpracování procesních dat v rámci platformy Statistica.
Nástroj ETL je speciálně optimalizován pro požadavky na vyhodnocení dat pomocí osvědčeného podnikového řešení Enterprise Server . Data, která se mají extrahovat, mohou pocházet ze standardních databází, jako jsou například databáze Oracle nebo SQL Server, soubory Statistica nebo speciální procesní databázový systém PI. Různé zdroje dat lze extrahovat, upravovat a přenášet do analytických tabulek v jednom kroku. Tento nastavený proces ETL může být zaznamenán a integrován do Enterprise Serveru , aby mohl být vyvolán a automatizován nebo později změněn.
To umožňuje analytikovi interaktivně kompilovat data z externích zdrojů v rozhraní Statistica způsobem, který je optimální pro analýzu dat. Následující analýzy dat mohou být prováděny interaktivně nebo automaticky, takže lze vytvořit automatizovaný proces od extrakce dat až po zprávu o analýze.

FUNKCE Modul tvorby pravidel

Neomezená tvorba parametrizovatelných pravidel a workflow

FUNKCE PI konektor

FUNKCE Variace

FUNKCE Testování hypotéz

Testování hypotéz (WoE) usnadňuje pochopení a modelování vztahů, kde existují binární cíle. Tak je tomu v mnoha průmyslových odvětvích, bez ohledu na to, zda jde o různé cílové kategorie jako "dobré" vs. "špatný", "zdraví" vs. "Nemoc" nebo "ano" "Ne".

S testováním hypotéz jsou proměnné rekodifikovány takovým způsobem, že separační síla k závislé proměnné je maximalizována. Metrické proměnné se převádějí do tříd a kategorické proměnné se rekodují.

V praxi si lze představit, jak se úvěrová splatnost snižuje s tím, jak se doba splácení zvyšuje. Každému (různě širokým) měsíčnímu intervalu je přiřazena hodnota WoE, což znamená, že negativní hodnoty WoE znamenají nepřiměřeně mnoho úvěrových ztrát.

Hledání nejefektivnějšího řešení probíhá automaticky pomocí metody rozhodovacího stromu, a to i pro více ovlivňujících se proměnných, a může také zvládnout odlehlé a chybějící data.

Uživatelé mohou určit, zda by měly být zobrazeny složité nelineární vztahy a interakce mezi ovlivňujícími proměnnými nebo by měly být zobrazeny pouze jednoduché trendy. Pro snadnější porozumění lze použít i méně granulární klasifikaci.

Kódování WoE je vydáno ve formě pravidel, které snadno aplikujete na data pouhým kliknutím.

S testováním hypotéz můžete často získat lepší výsledky při modelování, zejména při logické regresi. Vzhledem k tomu, že metrické hodnoty WoE jsou přiřazeny k třídám nebo kódům s přímým odkazem na cílové data, není zapotřebí fiktivního či efektivního kódování (což také často zahrnuje problémy s odhadem) a usnadňuje interpretaci modelů.

FUNKCE Data Mining

Funkce Data Mining (dolování dat) nástroje Statistica obsluhuje celý proces dolování dat - od vytvoření databázového dotazu až po vytvoření metody konečné sestavy – modul je výkonný a snadno použitelný.

Funkce Data Mining nástroje Statistica se přizpůsobují vašim potřebám a znalostem. Vyberte si mezi různými aplikačními režimy, které se liší možností obsluhy a stupněm automatizace:

V expertním režimu používáte celou řadu metod a možností.
Vizualizace projektu automatizuje celý proces dolování dat, od získávání dat až po výstupní výsledky.
Asistent vás provede nejdůležitějšími kroky analýzy s jasným návodem k použití.

Data Mining často přesouvá velmi velké objemy dat a provádí komplexní výpočty modelů - proto je nezbytným předpokladem dobrá výkonnost softwaru.

S datovými funkcemi společnosti Statistica jste dobře připraveni:

Optimalizované algoritmy vyvinuté pomocí nejmodernější technologie kompilátorů, 64bitové verze pro podporu rychlejších procesorů a k distribuci procesů na více procesorech.
Optimalizovaný přístup k čtení a zápisu do velkých databází:
Procesní technologie čte data asynchronně přímo z databázových serverů.

Serverová verze také umožňuje přenos všech výpočtů na vysoce výkonné víceprocesorové počítače a také z počítače v intranetu nebo Internetu prostřednictvím webového rozhraní - tedy bez instalovaných komponent Statistica - jsou řízeny.

Nejlepší metoda pro dolování dat neexistuje. Dobrý nástroj pro dolování dat musí proto nabízet širokou škálu metod. Funkce Data Mining softwaru Statistica jsou ideální pro tyto použití:

Četné metody přípravy dat, jako je filtrování, výběr a transformace
Výběr funkcí pro identifikaci relevantních prediktorů
Klasifikační a regresní stromy (CART, CHAID), interaktivní rozhodovací stromy, posílené stromy a náhodné lesy
Generalizované doplňkové modely, MAR Splines
EM a k-menas-clustering, nezávislá analýza komponent, jednoduchá a sekvenční pravidla přidružení
Postupy neuronové sítě včetně samoorganizačních map (SOM)
K-nearest sousedé, podpůrné vektorové stroje (SVM), Bayesovský postup
Techniky jako Hlasování, Bagging, Boosting, Meta-Learning
všechny jednoduché a vyšší statistické metody (jako je regrese, diskriminace a analýzy časových řad)
vynikající interaktivní vizualizační nástroje a mnohem více

Scénáře
Požadavky na dolování dat jsou různorodé ve všech odvětvích: Banky, pojišťovny, Mass-media, maloobchod, zásilkový obchod, e-commerce nebo telekomunikační společnosti je již úspěšně používají. Ale i průmyslová výroba, logistika, biochemie, výzkum, medicína a farmaceutický výzkum se stále setkává s potřebou dolování dat k optimalizaci procesů a zkoumání příčiny.

Tradiční data mining aplikace
zákaznická segmentace nabízí segmentaci zákazníků do skupin s podobnými sociodemografickými profily a poptávkovými modely pro cílený přístup.

Vyhodnocení rizik
Předpovědi na základě již získaných dat, aby se minimalizovalo riziko selhání. Vytvořte modely a scénáře pro hodnocení rizik. Vyhodnoťte úvěrové riziko podle Basel II.

Optimalizace marketingu
Zvyšte odezvu a návratnost investic vašich přímých marketingových kampaní: individuálním kontaktem s klientem, frekvencí zasílání a nabídkou na míru. Optimalizujte up i cross-selling.

Nákupní košík a webové analýzy
Které produkty a služby by měly být nabídnuty zákazníkům? A za jakých podmínek? Volby vašich zákazníků vám dávají odpovědi.

Další scénáře CRM
Využívání dolování dat v analytickém CRM pro detekci podvodů, analýzy zákaznické hodnoty či správu stížností.

Dolování dat v průmyslovém prostředí
Optimalizace
Automatizované procesy potřebují ukládat data při vysokých rychlostech, zejména v průmyslové výrobě nebo výrobě elektrické energie. Pomocí dolování dat můžete dokonce určit rozhodující parametry hromadných sběrů dat. Simulace vám ukazují, co můžete skutečně zlepšit.

Zabezpečení kvality
Sledujte celou řadu vlastností kvality současně s mapami víceřádkových kontrol. Online monitorování a prognózy v reálném čase umožňují opětovné úpravy během probíhajícího výrobního procesu.

Analýza chyb
Zjištění chyb a chybových vzorků v přípravě surovin, ve výrobním procesu nebo v hotových výrobcích. Pravidla přidružení odhalují častý výskyt různých problémů s kvalitou nebo typických chybových sekvencí. Interaktivní rozhodovací stromy umožňují flexibilní a srozumitelnou analýzu základních příčin.
Vývojové nástroje Nástroj umožňuje exportovat připravené prognostické modely v různých programovacích jazycích (např. C #, Java, SQL uložené procedury). To umožňuje, aby modely byly použity přímo v koncovém aplikaci či nástroji, například k dosažení maximálního výkonu a nemusely se nejprve přenášet data na servery přes složité infrastruktury.
Existující kódy PMML mohou být také konvertovány do různých jazyků pomocí převodníku modelů i po vytvoření modelu. Zahrnuje také aplikaci Java for MapReduce, která umožňuje používat předpovědní modely přímo v prostředí Hadoop.
Funkce analýzy v databázi také umožňuje, aby byly celé procesy analýzy analyzovány přímo databázi.

FUNKCE Optimalizace procesů

FUNKCE Text Mining

Statistika Text Mining transformuje nestrukturovaná textová data do srozumitelné a použitelné formy, kterou následně můžete zpracovat přes různé rozhodovací procesy. Ve skutečnosti jsou data v mnoha formátech a nelze je vždy přímo hodnotit. Statistické dolování textu obsahuje umožnuje vysledovat další, zdánlivě skryté informace.

Funkce pro dolování textu v programu Statistica poskytují bohatou a výkonnou sadu nástrojů. Jsou navrženy tak, aby byly vysoce efektivní a škálovatelné díky nejmodernějším technologiím, aby co nejlépe využívaly sofistikované víceprocesorové serverové systémy. Analytické nástroje lze aplikovat na textové dokumenty nebo webové stránky. Ale i z předběžně zpracovaných bitmap a zvukových souborů mohou být nestrukturované informace roztříděny, seskupeny nebo jinak zahrnuty do analýzy.

FUNKCE In-Database Analytics

S In-datrabase analytikou (vyžaduje server Enterprise Server ) lze procesy analýzy provádět externě přímo v databázích. V grafickém rozhraní projektu Statistica jsou připraveny a připojeny interní databázové analytické uzly. Tyto procesy se pak provádějí přímo v databázi a pouze výsledky jsou přenášeny uživateli. Podporované operace zahrnují: výpočet statistik a korelaci, odhad regresních modelů, vzorkování a filtrování, výběr prvků, rozhodovací stromy a mnoho dalších. Kromě klasických databází, jako jsou například Microsoft SQL Server, Teradata, Oracle a další, je podporován i Apache Hive.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Ke stažení

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Napište nám

Unikátní know-how a špičkové analytické nástroje

Jsou vypsané květnové a červnové termíny na kurzy

Statistica 13: Novinky v nové verzi

Akademická sféra

Proč byste měli používat právě TIBCO Statistica™?

Výhody TIBCO Statistica™, které pro Vás umíme zajistit:

Co Vám přinese tato volba?

Výzkum a vývoj

Průmysl 4.0

Big Data

Výroba

Farmacie

Bankovní služby

GDPR

IOT (Internet of Things)

Analýza síly testu

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Předchozí kurzy

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Analýza přežití

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Předchozí kurzy

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Ovládání programu TIBCO Statistica

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Analýza kategoriálních dat

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Předchozí kurzy

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Analýza rozptylu

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Předchozí kurzy

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Časové řady a predikce

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Předchozí kurzy

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Logistická, ordinální a multinomická regrese

Cílová skupina

Cíle kurzu

Osnova

Předpoklady účastníka

Předchozí kurzy

Navazující kurzy

Certifikace

Přihláška do kurzu (nezávazně)

Neparametrická statistika

Cílová skupina