(+420) 732 217 132
Volejte Po - Pá: 9.00 - 16.00 hod

info@statistica.pro
Odpovíme do 1 pracovního dne

Sídlo společnosti:
ArcIT Consulting, s.r.o.
Tylova 473/27
Plzeň 3
IČ: 05689651
DIČ: CZ05689651

Kanceláře:
ArcIT Consulting s.r.o.
Zelený Pruh 95/97
140 00 Praha 4

Kurzy a semináře se konají na adrese:
Kuta a.s.
Zelený Pruh 95/97
140 00 Praha 4


Zapsána u Krajského soudu v Plzni, oddíl C, složka 33739

Napište nám

Statistica.pro je projektem ArcIT Consulting s.r.o.
Zavřít

Unikátní know-how a špičkové analytické nástroje

Představujeme vám, jak maximálně využít nástroje pro zpracování a vyhodnocení dat. 

Web STATISTICA.PRO je tu, aby Vám představil nástroje a postupy, které vedou k maximálnímu využití dat, ať už ve vašem nebo korporátním byznyse. Web Vám nabídne detailní popis nástrojů společnosti TIBCO Sotware Inc. a know-how spojené s implementací těchto a dalších nástrojů do specifických odvětví podnikání.

TIBCO Software Inc. je americká společnost poskytující firmám integraci, analýzu a zpracování dat pro použití on-premise nebo v prostředí cloud computingu. Nabízí software spravující informace a podporující rozhodování a optimalizace procesů a pro více než 10 000 zákazníků. Klienti zahrnují společnosti AirFrance, KLM, Citi, Conway, ING, Marks a Spencer, Nielsen, Shell, University of Chicago Medicine, Western Union. Společnost je novým vlastníkem nástroje Statistica, společnosti StatSoft (www.statsoft.cz)

STATISTICA.PRO nabízí know-how a nástroje pro samotnou realizaci datové extrakce z různých datových zdrojů, následné vyhodnocení dat a další zpracování ve formě reportů nebo napojení na systémy třetích stran.

Využijte našich zkušeností z implementace projektu v oblasti PRŮMYSLU 4.0 a nechte si vypracovat kompletní strategii datového zpracování. Poptejte konkrétní systém, který by Vaše požadavky vyřešil nebo se přihlašte na některý z našich kurzů, který se pokročilým vyhodnocením dat zabývá.

Zanechte nám vzkaz a my se Vám ozveme:

Zavřít
04 / 04 / 2018

Jsou vypsané květnové a červnové termíny na kurzy

Obnovené tradiční kurzy na celou škálu analytických metod a také na ovládání nástroje STATISTICA jsou vypsány na květen a srpen. Hlaste se přes formuláře pod vybranným kurze. V případě, že je již garantovaný termín, je u kurzu již konkrétní datum konání.

Zavřít
01 / 04 / 2018

Statistica 13: Novinky v nové verzi

Neznáte Statisticu? Tak začněte tady:
Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších. O využití softwaru se lze dočíst v sekci Publikační činnost a v záložce Případové studie. Analytická platforma Statistica umožní organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do provozu.

Statisticu znám a chci vedět, co je nového:
Statistica 13 - je nejnovější verze analytického softwaru, která přináší mnoho významných vylepšení.

Stručný výčet těch nejdůležitějších novinek v aktuální verzi:

Možnost definovat si analytické workflow nyní pro všechny verze –rozhraní Statistica Workspace bylo významně vylepšeno a je k dispozici v každé verzi softwaru Statistica.

Manuální kroková regrese – k manuální (uživatel si sám může volit v každém kroku, které prediktory přidá, nebo odstraní) krokové logistické regresi byla přidána i klasická lineární a Coxova regrese.

Posílení dataminingových algoritmů pro řešení Statistica Data Miner – pro posílení dataminingových algoritmů byly přidány krokové modelovací techniky. Hlavní výhodou krokové výstavby modelu je možnost ručně přidávat nejdůležitější prediktory a sledovat jejich vliv na model. Funkcionalita what-if umožní definovat modely, které jsou v souladu se směrnicemi a politikou společnosti. Více informací se dočtete zde.

Nový modul pro vizualizaci dat – Statistica Interactive Visualizations & Dashboards. Jde o nový modul pro pokročilou a interaktivní vizualizaci dat, který umožní snadnou vizualizaci rozsáhlých a dynamicky se měnicích dat (obchodní data, energetika, průmysl atd.). Díky tomuto modulu budete mít neustálý přehled o vývoji klíčových údajů. Tento modul je součástí trial verze Statistica 13.

Big Data – pokročilá platforma pro analýzu těch nejrozsáhlejších datových zdrojů. Díky mnoha vylepšením (Native Distributed Analytics (NDA), analytika nad Hadoop atd.) umožňuje řešení Statistica zpracovávat obrovské objemy dat s maximální efektivitou. Více informací se lze dočíst zde.

Další informace o posledních novinkách (Edge scoring atd.) se dočtete zde, dále také na http://statistica.io.

Zavřít
Zvýhodněné programy pro školy

Akademická sféra

  • Statistica do škol
  • Výhody pro školy
  • Akademické programy
TIBCO Statistica™ je trvale uznávána jako jeden z nejintuitivnějších a nejsnadněji použitelných softwaru pro zpracování dat na trhu.

Proč byste měli používat právě TIBCO Statistica™?

Snadné použití
Není potřeba kódování - Pokud víte, jak používat aplikace Microsoft Windows, jako je Excel nebo Word, pak víte, jak používat TIBCO Statistica™.

Komplexní algoritmy pro strojové učení a text mining – Statistica
Obsahuje komplexní výběr clusteringových technik, architektury neuronových sítí, klasifikačních / regresních stromů (také nazývaných rekurzivní dělící metody), multivariační modelování (včetně MARSplines) a mnoho dalších prediktivních technik pro strukturované i nestrukturované údaje.

Tzv. Drag-and-drop UI pro snadné vkládání dat

Grafické nástroje pro vytváření dotazů usnadňují přímé napojení na externí databáze. Přehledně vytvářejí, spravují a ukládají vlastní pracovní postupy s možnostmi vyhledávání.

Bezproblémová integrace s jazyky C #, R a Python.
Pokud píšete skripty jazyce C #, R nebo Python, bude se vám Statistica líbit. Statistica přečte a zapisuje data z prakticky všech standardních formátů souborů, včetně starších a konkurenčních produktů.

Nízké náklady pro akademickou sféru
Chápeme rozpočtové omezení, kterým čelí fakulty a studenti ve vzdělávacích institucích, a proto se snažíme dělat Statisticu cenově přístupnou. Neváhejte nás oslovit pro konkrétní nabídku.

Budoucnost vašeho povolání
Protože je široce využívána mimo akademickou sféru. Zkušenosti se Statistica zvýší vaší pracovní kvalifikaci. Budete připraveni nabídnout své dovednosti do oblastí s vysokou poptávkou zahrnující populární Big Data, prediktivní analýzu, internet věcí a mnohé další.

Výhody TIBCO Statistica™, které pro Vás umíme zajistit:

TIBCO Statistica™ v češtině
Jediný lokalizovaný komplexní profesionální systém (aktuálně verze 12.x)

Reference a případové studie z celého světa
TIBCO Statistica™ se využívá například na Yale University, Cambridge University, ,Masarykově univerzitě v Brně, Mendelově univerzitě v Brně, ČZU v Praze, VŠCHT v Praze, UTB ve Zlíně či v Akademii věd ČR.

Kvalifikovaná školení práce s produktem i s daty
Kromě elektronické učebnice a výukových materiálů nabízíme také školení na samotné ovládání nástroje nebo na příbuzná analytická témata. Školení vedou kvalifikovaní odborníci z akademické sféry i z praxe.

Aktuální program TIBCO Statistica™ pro školy
Tento projekt je určen speciálně pro školy, tak aby měly k dispozici špičkový analytický software lokalizovaný do češtiny, a mohly se zabývat vlastní analýzou dat a interpretací výsledků.
Software je přitom univerzitě poskytnut za zvýhodněných podmínek, aby byl co nejvíce přístupný všem členům akademické obce. Studenti tak přímo na univerzitě přicházejí do styku s profesionálním softwarem, což je pro ně vklad na celý život.
Související služby zahrnují jak podporu co nejrychlejšího využívání software, tak i konzultace vlastních metod analýzy dat. Studenti i pedagogové se např. mohou účastnit našich kurzů (http://www.datascript.cz/kurzy/tibco-statistica) za zvýhodněných podmínek.

Tento projekt již aplikovaly pro své studenty například Česká zemědělská univerzita v Praze, Masarykova univerzita, Mendelova univerzita v Brně, Univerzita Palackého v Olomouci, Vysoké učení technické Brno, Jihočeská univerzita v Českých Budějovicích, VŠCHT, Univerzita Karlova - 1.lékařská fakulta a další.

Akademická multilicence
Speciálně v rámci tohoto projektu existuje možnost rozsáhlého počtu instalací pro celofakultní či celouniverzitní využití.

Co Vám přinese tato volba?

  • software pro všechny a všude (studenti, zaměstnanci, ve škole, doma, na noteboocích atd.)
  • možnost dlouhodobější spolupráce – 1 - 5 let
  • díky tomuto projektu získáte velké cenové zvýhodnění oproti jiným organizacím
  • všechny upgrady a technická podpora jsou zdarma po dobu užívání softwaru
  • software je automaticky v češtině i v angličtině – vynikající možnost pro výuku zahraničních studentů

Cena tohoto řešení je odvozena od počtu instalací a dle vybraných modulů.
Neváhejte nás kontaktovat a nechat si připravit individuální nabídku

 

 

Zavřít
Pokročilá analytika pro vědu a výzkum

Výzkum a vývoj

Zavřít
Naplnění iniciativy, Analýza výrobních linek, SW podpora

Průmysl 4.0

Zavřít
Machine learning, Analýza velkých dat

Big Data

Zavřít
MES, Prediktivní modely, SixSigma

Výroba

Zavřít
Datová integrace, Pokročilá analytika, Big Data

Farmacie

Zavřít
Rozhodovací modely, Risk Management, Real-Time Monitoring transakcí nebo Strojové učení. Know-how, reference a celosvětově uznávané nástroje na zpracování dat. 

Bankovní služby

Back-office proces

Naše technologie umožňují integrovat a v reálném čase extrahovat několik procesů najednou. Takové datové extrakce zvyšují produktivitu, snižují dobu zpracování a snižují náklady. Nabízíme zavedení parametrizovatelných workflow, pokročilé analytiky či real-timového streamování.

Řízení rizik

Poskytuje výkon a rychlost potřebnou pro výpočet rizik za zlomek nákladů oproti tradičním řešením. Inovace v oblasti veřejných a soukromých cloudových technologií umožňují urychlit rozhodovací procesy a získat tak konkurenční výhodu v celé řadě agend souvisejících s vyhodnocením rizik a to včetně: oceňování aktiv, vysokofrekvenční obchodování (HFT), management obchodních rizik a v risk reportingu.

Dohled nad platebními transakcemi

Retailové banky či banky pro správu majetku mohou výrazně redukovat míru "falešně pozitivních" nálezů, a to pomocí schopností strojového učení. Dokážeme modely přizpůsobit jednoduchým přidáním nových atributů nebo změnou klíčových parametrů.

Jaké produkty můžeme doporučit:

  • TIBCO Statistica
  • TIBCO Spotfire
  • TIBCO StreamBase

 

 

Zavřít
Datová integrace, analýza dat

GDPR

Zavřít
Integrace dat, Analitika senzorů, Alerting

IOT (Internet of Things)

Zavřít
  • 04 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Analýza síly testu

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Kurz se věnuje práci s modulem analýza síly testu. Posluchači se dozví, na jakém principu je stanoven minimální rozsah vzorku dat pro dosažení konkrétního typu testu o dané síle, jak tento odhad získat, jak v TIBCO Statistica stanovit sílu testu.

Určení velikosti vzorku je jeden z důležitých kroků před provedením jakéhokoli experimentu či studie a může ušetřit spoustu problémů vzniklých vyhodnocováním nesprávně navrhnuté studie.

Cílová skupina

  • Kdokoli, kdo uvažuje o plánování experimentu a zajímá se, jak velký vzorek dat musí nasbírat.
  • Typickým publikem jsou především lidé zpracovávající data z oblasti medicíny či farmacie.

Cíle kurzu

  • Pochopení toho, proč je nutné zabývat se analýzou síly testu.
  • Naučit se, jak stanovit minimální počet potřebných pozorování pro dosažení potřebné síly testu.
  • Detailní seznámení s modulem Analýza síly testu.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Princip testování hypotéz

Vybrané statistické testy a jejich použití

Určení síly testu

Určení minimálního rozsahu vzorku dat

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování.

Předchozí kurzy

Vhodné je absolvovat před tímto kurzem některý kurz zahrnující teorii testování hypotéz:

Základní kurz statistiky I,

Analýza rozptylu.

Navazující kurzy

Jelikož kurz pokrývá nejrůznější metody testování hypotéz, mohou být pro účastníky zajímavé kurzy detailně rozebírající teorii k daným testům. Například:

Analýza rozptylu,

Analýza přežití,

Analýza kategoriálních dat,

Základní kurz statistiky,

Statistika v lékařství I.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 04 / 04 / 2018
  • Obecná analýza dat
  • Pro profesionály

Analýza přežití

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Cílem jednodenního kurzu je seznámit účastníky se základními statistickými metodami používanými v analýze přežití. Kurz je určen především zájemcům, kteří se zabývají biomedicínským výzkumem, ale i jinými oblastmi, kde se pracuje s neúplnými (cenzorovanými) daty týkajících se dob do sledované události. Všechny probírané metody budou procvičeny na konkrétních příkladech.

Cílová skupina

  • Kdokoli, kdo se setkává s cenzorovanými daty (doby do sledované události).
  • Zájemci, zabývající se biomedicínským výzkumem.
  • Může se hodit také zájemcům jiným medicínských oborů, ale také zájemcům z oblasti financí či průmyslu.

Cíle kurzu

  • Porozumět podstatě a rozdílu cenzurovaných dat.
  • Naučit se metody, které byly pro tento typ dat odvozeny.
  • Naučit se interpretovat výsledky metod a to nejen číselné, ale i grafické.
  • Dokázat si zpracovat samostatně data pomocí softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do analýzy přežití

  • Základní pojmy: doba do události, typy cenzorování
  • Rozdělení doby do události: funkce přežití, riziková funkce

Jednovýběrový problém

  • Kaplanův-Meierův odhad funkce přežití
  • Úmrtnostní tabulky

Srovnání dvou skupin

  • Logrankový test, zobecněné Wilcoxonovy testy

Regresní analýza

  • Coxův model proporcionálních rizik
  • Parametrické regresní modely

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.

Navazující kurzy

Kurz Analýza přežití je speciální kurz pro specifický typ dat a pokrývá základ této problematiky, stejně jako funkcionality softwaru, navazující kurz na stejné téma tedy není. Pro vzdělávání v dalších oblastech analýzy dat si můžete vybrat z nabídky našich kurzů podle problematiky, kterou hledáte.

Vzhledem k častému využití v medicíně můžeme doporučit následující kurzy:

Analýza rozptylu,

Statistika v lékařství II,

Analýza síly testu ve STATISTICA.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 04 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Ovládání programu TIBCO Statistica

1
Zelený Pruh 95/97, Praha 4
5490,- Kč bez DPH

Tento jednodenní kurz je určen těm, kteří se zajímají o možnosti získávání a vyhodnocování informací z textových dokumentů, nejčastěji z webových zdrojů, ale i ze souboru textových dokumentů nebo různých databází. Cílem kurzu je ukázat možnosti jak pracovat s vágními textovými informacemi a jak z nich získat užitečnou informaci pro další zpracování a rozhodování. Využití text miningu lze spatřovat například v oblasti sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cílová skupina

  • Analytici, datoví specialisté či statistici, kteří chtějí využít informace v datech ve formě nestrukturovaného textu.
  • Text mining se využívá v oblastech sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cíle kurzu

  • Ukázat, jak a čím může být metodologie text miningu přínosná.
  • Pochopit, jak může v úlohách text miningu přispět software TIBCO Statistica.
  • Ukázat si, jaké všechny možnosti a nastavení lze použít.
  • Vysvětlit si pojmy, které se běžně v souvislosti s text miningem vyskytují
  • Naučit se, jak využít získanou informaci ve formě indexového souboru pro další analýzy.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy
  • Seznámení s prostředím TIBCO Statistica
  • Načtení dat, různé typy výstupů, získání dat z databáze
  • Možnosti grafických výstupů

Účel, princip a zdroje text miningu

Nastavení podmínek pro prohledávání a nastavení filtrů

  • Výběr jazyka, zastoupení slov,…
  • Nastavení frází, povolených, zakázaných slov, synonym
  • Nastavení délky slov, max. počet souhlásek, povolených znaků, atd.

Vytvoření a práce s indexovým souborem a frekvenční maticí

Výběr významných příznaků (prediktorů) pro klasifikační úlohu

Klasifikace

  • Klasifikační stromy
  • Metody strojového učení
  • Neuronové sítě

Shluková analýza nad získanými daty

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.

Navazující kurzy

Logickým navázáním na kurz je detailní vysvětlení metodologie, jak používat výsledky z textminingové analýzy.

Vhodnými tedy mohou být kurzy:

  • Data Mining (dvoudenní nebo třídenní varianta)
  • Neuronové sítě
  • Klasifikační a regresní stromy

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 04 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Analýza kategoriálních dat

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Cílem jednodenního kurzu je seznámit účastníky se základními statistickými metodami určenými pro řešení problémů zahrnujících kategoriální (kvalitativní) data. Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech. Důraz je kladen na praktické použití daných metod a na interpretaci výsledků.

Cílová skupina

  • Kdokoli, kdo pracuje či potřebuje zpracovávat kategoriální data.
  • Metody jsou univerzální a použitelné pro nejrůznější obory, pro je kurz určen širokému okruhu zájemců.

Cíle kurzu

  • Porozumět základním metodám pro analýzu kategoriálních dat
  • Umět vyhodnocovat a interpretovat výsledky těchto metod.
  • Umět získat výsledky za pomoci softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Popisná statistika

Statistické metody pro proporce

Analýza závislosti dvou dichotomických znaků (kontingenční tabulky 2x2)

Analýza závislosti dvou obecných kategoriálních znaků (kontingenční tabulky IxJ)

Statistické metody pro párová kategoriální data

Loglineární modely pro kontingenční tabulky (nástin)

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.
  • Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.

Navazující kurzy

Přímo navazujícím kurzem je kurz:

Logistická, multinomická a ordinální regrese.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Analýza rozptylu

1 den
Zelený Pruh 95/97, 140 00 Praha 4
7900,- Kč bez DPH

Cílem tohoto jednodenního kurzu je představit metody pro porovnávání dvou a více skupin. Kurz se zabývá modely analýzy rozptylu (jednoduché, dvojné třídění, hierarchická ANOVA), zobecněním ANCOVA či MANOVA a alternativními neparametrickými metodami. Prostor je věnován i metodám pro ověření předpokladů  a post-hoc testům pro mnohonásobná porovnání.

Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech.

Cílová skupina

  • Ti, kteří se chtějí naučit či rozšířit své znalosti v oblasti analýzy rozptylu. Tedy analýz, kde se práme, zda se nezávislý spojitý znak chová v různých skupinách stejně.

Cíle kurzu

  • Naučit se statisticky porovnávat data pro více skupin a interpretovat správně dosažené výsledky.
  • Naučit se, který typ analýzy použít pro daný úkol.
  • Naučit se principy metod nejen teoreticky, ale umět je použít i prakticky.
  • Naučit se, jak potřebné analýzy provést v programu TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do analýzy rozptylu

  • Zopakování principu testování hypotéz
  • Testy pro dva výběry (nepárové, párové a neparametrické)

Metody analýzy rozptylu

  • Ověřování předpokladů metod ANOVA
  • Jednofaktorová ANOVA
  • ANOVA pro opakovaná měření
  • Analýza kovariance
  • Hierarchická ANOVA
  • Vícerozměrná analýza rozptylu (MANOVA)

Neparametrické metody analýzy rozptylu

  • Kruskal-Wallisův test
  • Friedmanova ANOVA

Post-hoc testy

  • Fisherův, Scheffého,…

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.

Navazující kurzy

především s přihlédnutím na konkrétní typ analýz, které chce uživatel vykonávat.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro profesionály

Časové řady a predikce

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Dvoudenní kurz je určen všem, kteří chtějí porozumět metodám pro analýzu a modelování časových řad. Po úvodním seznámení se základními pojmy budou vysvětleny nejrůznější metody, které umožňují predikovat chování časových řad do budoucnosti a také ohodnotit správnost výsledků. Vše je demonstrováno na příkladech z praxe.

Cílová skupina

  • Kdokoli, kdo pracuje s časově zatíženými daty.
  • Typickými posluchači mohou být lidé z oblasti finančnictví, ale stejně tak třeba i oblasti průmyslu.

Cíle kurzu

  • Porozumět základním pojmům z oblasti časových řad.
  • Pochopit specifika práce s časovou řadou oproti ostatním datovým typům.
  • Naučit se běžně používaným metodám pro analýzu časových řad.
  • Naučit se vyhodnotit, která metoda je vhodná pro danou úlohu.
  • Praktické použití metodologie časových řad v softwaru TIBCO Statistica
  • Detailní seznámení s funkcionalitou Časové řady a predikce v softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do časových řad

  • Příklady časových řad
  • Jednoduché modely časových řad:
  • Modely s nulovou střední hodnotou
  • Modely s trendem
  • Modely se sezónností
  • Stacionární modely
  • Autokorelační funkce
  • Odhady trendu a sezónních komponent
  • Filtrování trendu a sezónních komponent
  • Testování šumové náhodné posloupnosti

Stacionární procesy

  • Lineární modely
  • ARMA procesy
  • Autokorelační funkce (ACF)
  • Predikce stacionárních časových řad
  • Odhadování trendu a predikce pomocí regresní analýzy

Exponencionální vyrovnávání

  • Bez trendu
  • S trendem

ARMA modely

  • ACF a PACF pro ARMA ( p, q )
  • Predikce ARMA modelů
  • Odhad řádu ARMA

Nestacionární a sezonní modely

  • ARIMA modely
  • Identifikace
  • Predikce ARIMA modelů
  • Sezonní ARIMA modely

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Před tímto je vhodné absolvovat Základní kurz statistiky I.

Předchozí kurzy

Základní kurz statistiky I.

Navazující kurzy

Tématiku časových řad také částečně pokrývají dataminingové metody, konkrétně neuronové sítě, je tedy možné navštívit také kurzy:

Data mining (dvoudenní varianta) nebo

Data mining (třídenní varianta) nebo

Neuronové sítě.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro profesionály

Logistická, ordinální a multinomická regrese

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Cílem jednodenního kurzu je seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu. Posluchačům bude vysvětlen pojem poměru šancí (odds ratio) a jeho vztah k logistické regresi, jež umožňuje modelovat závislost 0/1 odezvy (typicky indikátoru zda nastala nebo nenastala nějaká událost) na kvalitativních i kvantitativních prediktorech obdobně jako v klasické lineární regresi. Model logistické regrese bude postupně dáván do souvislosti s klasickými postupy (dvouvýběrový t-test, analýza rozptylu, lineární regrese). V další části kurzu navážeme multinomickým logistickým modelem (multinomial logit model, umožňuje modelovat kategoriální odezvu) a dále modelem proporcionálních šancí (proportional odds model).

V poslední části ukážeme využití logistické regrese k vytvoření binárního klasifikátoru (diagnostický test) a vysvětlíme související pojmy sensitivity, specificity, pozitivní a negativní prediktivní hodnoty, ROC křivky. Jednotlivé metody budou ilustrovány na příkladech z lékařského i bankovního prostředí (credit skóring).

Cílová skupina

  • Statistici, datoví specialisté či analytici, kteří potřebují řešit úlohu predikce kategorické veličiny.
  • S potřebou takovýchto regresních modelů se setkáváme v oblasti bankovnictví, pojišťovnictví, medicíny, ale také například v oblasti společenských věd.
  • Ti, kteří se potřebují naučit, jak provést výše zmíněné typy regrese v softwaru TIBCO Statistica.

Cíle kurzu

  • Seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu.
  • Naučit posluchače pracovat a porozumět charakteristikám jako jsou poměr šancí nebo ROC křivka.
  • Naučit se vybrat, kterými metodami modelovat daná kategorická data, které proměnné přidat do finálního modelu a které ne.
  • Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Inference o proporci  (stručně, je též obsahem kurzu „Analýza kategoriálních dat“)

Kvantifikace odlišnosti dvou skupin vzhledem k proporci

  • Rozdíl proporcí
  • Relativní riziko
  • Poměr šancí – odds ratio

Jednoduchá logistická regrese

Vícenásobná logistická regrese

Multinomická logistická regrese

Model proporcionálních šancí

Logistická regrese k vytvoření binárního klasifikátoru

  • Pojem ROC křivky

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows, výhodou je předchozí absolvování kurzu Analýza kategoriálních dat, ale není podmínkou.

Předchozí kurzy

Doporučujeme absolvovat kurz Analýza kategoriálních dat, na který kurz Logistické, ordinální a multinomické regrese logicky navazuje.

Navazující kurzy

Tématiku regresních modelů pro spojité veličiny je možné doplnit kurzy:

Analýza rozptylu,

Regresní analýza.

Možností, jak předpovídat kategorickou odezvu, je více. Mohou se hodit například dataminingové metody:

Klasifikační a regresní stromy nebo

Data mining (dvoudenní varianta) .

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Neparametrická statistika

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Kurz je zaměřen na statistické metody, které nevyžadují nutně splnění předpokladů o pravděpodobnostním rozdělení náhodných veličin (normální, atd.), případně i jiných předpokladů. Tyto metody lze tedy univerzálně využívat napříč všemi obory. Kurz je určen všem, kteří se chtějí dozvědět o neparametrických alternativách klasickým testů.

Cílová skupina

  • Kurz je vhodný pro všechny, kteří mají ve svých datech problémy s dodržením předpokladů klasických metod.
  • Zájemce, kteří se chtějí dozvědět o alternativách základních parametrických charakteristik a testů.
  • Vědečtí pracovníci, kteří si chtějí ujasnit své postupy.
  • Kurz je vhodný pro ty, kteří chtějí doplnit své teoretické znalosti o této metodologii.
  • Typickými obory, kde jsou neparametrické metody potřeba, jsou oblasti medicíny a farmacie.

Cíle kurzu

  • Posluchači se naučí používat neparametrické alternativy klasických metod.
  • Naučit se ověřovat předpoklady metod.
  • Umět se rozhodnout, kterou metodu vybrat pro daná data.
  • Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Testy normality

  • Grafická analýza
  • Testy hypotéz o normálním rozdělení

Odlehlá pozorování

  • Příklady negativních důsledků přítomnosti odlehlých pozorování
  • Identifikace odlehlých hodnot (Grubbsův test, grafická identifikace)
  • Očištění datového souboru

Popisná statistika

  • Neparametrické míry polohy a variability
  • Boxplot
  • Bagplot

Neparametrické testy

  • Alternativy k t-testům
  • Neparametrická ANOVA
  • Testy pro kontingenční tabulky

Spearmanův korelační koeficient

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Základní kurz statistiky I nebo Statistika v lékařství I.

Navazující kurzy

Je možné rozšířit si znalosti o parametrických metodách a to prostřednictvím kurzů:

Analýza rozptylu,

Regresní analýza,

Základní kurz statistiky II.

Co se týče navázáním metodami, které nemají tak striktní předpoklady, pak lze doporučit pro regresní a klasifikační úlohy dataminingové metody:

Klasifikační a regresní stromy,

Neuronové sítě nebo

Data mining (dvoudenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Praktická analýza dat

2
Zelený Pruh 95/97, Praha 4
12400,- Kč bez DPH

Dvoudenní kurz Praktická analýza dat je určen těm, kteří potřebují s analýzou začít, ale Základní kurz statistiky I má pro ně příliš širokou osnovu. Tento kurz klade důraz na procvičování samostatných úloh týkajících se zpracování dat z různých oblastí lidské činnosti. Podrobněji budou vysvětlena témata typy proměnných, popisná statistika, vizualizace výsledků, vztahy proměnných a interpretace výsledků.

Cílová skupina

  • Kurz je vhodný zejména pro ty, kteří se zpracování dat nikdy nevěnovali, začínají s ním, nebo pouze chtějí prohloubit své znalosti v oblasti Business intelligence.
  • Ti, kteří potřebují s analýzou dat začít, ale Základní kurz statistiky I má pro ně příliš širokou osnovu.

Cíle kurzu

  • Nosným cílem školení je předat účastníkům maximální know-how potřebné pro samostatnou práci nad daty
  • předat účastníkům maximální know-how potřebné pro samostatnou práci nad daty
  • Naučit účastníky porozumět základním statistickým přístupům, které budou využitelné v praxi při zpracování provozních dat.
  • Naučit se běžně využívané přístupy nejen teoreticky, ale i v softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do analýzy dat

  • Proč to děláme
  • Typy proměnných (měřítka)
  • Načtení dat, různé typy výstupů
  • Příprava datového souboru (tvorba nových proměnných, překódování, filtrování)

Popisná statistika

  • Průměr, medián, míry variability
  • Základní přístupy k analýze dat podle typu proměnné (charakteristiky polohy a variability)
  • Vhodná vizualizace dat
  • Vliv a detekce odlehlých hodnot
  • Normální rozdělení a ověření normality dat

Vztah dvou veličin

  • Jak poznat vliv jiné proměnné na sledované hodnoty (vztah dvou veličin)
  • Korelace, kontingence (jednotlivé kroky, interpretace výsledků)

Vybrané pokročilejší metody

  • Úvod do statistického usuzování
  • Ukázky pokročilejších přístupů (vícerozměrná analýzy, modelování odezvy, data mining), aneb Rozšíření statistických obzorů

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.

Předchozí kurzy

Jedná se o úplně nejzákladnější kurz, není potřeba tedy absolvovat žádné předchozí kurzy.

Navazující kurzy

Navazujícím kurzem pro komplexní obecné vzdělávání je:

Základní kurz statistiky II, případně Základní kurz statistiky I, nicméně ten se částečně s kurzem Praktické analýzy dat překrývá.

Pokud si chcete rozšířit znalosti konkrétní problematiky, pak je pro Vás k dispozici celá řada specializovaných kurzů jako jsou:

Analýza rozptylu,

Regresní analýza,

Neparametrická statistika,

Analýza kategoriálních dat,

Vícerozměrné statistické metody,

Časové řady a predikce.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Příprava a zpracování dat

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Příprava a zpracování dat patří mezi nejpracnější úkoly celého procesu analýzy dat. Tento jednodenní kurz Vám pomůže podrobně se seznámit s obsluhou softwaru TIBCO Statistica při přípravě datového souboru. Během kurzu bude účastník seznámen se základními postupy přípravy datového souboru před započetím vlastní analýzy. Bude prezentována široká škála postupů a funkcí, které umožňují průzkum datového souboru, úpravu dat, simulace chybějících hodnot, filtrace dat, vzorkování. Jedná se o vhodné doplnění znalostí k základním kurzům či kurzu data miningu.

Cílová skupina

  • Všichni, kteří se chtějí seznámit s postupy, jak správně připravit datový soubor před samotnou analýzou dat.
  • Všichni, kteří se chtějí seznámit s problémy, které se mohou vyskytovat v datech a také s metodami, jak tyto problémy odstranit.
  • Ti, kteří se chtějí naučit připravovat data v softwaru TIBCO Statistica.

Cíle kurzu

  • Porozumět nutnosti přípravy a zpracování dat.
  • Naučit se běžně využívané přístupy nejen teoreticky, ale i v softwaru TIBCO Statistica.
  • Umět si samostatně připravit data pro analýzu a vyřešit problémy, které se mohou v datech vyskytnout.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy
  • Seznámení s prostředím TIBCO Statistica

Plánování výzkumu

Datová reprezentace

  • Typy proměnných
  • Datová reprezentace v programu TIBCO Statistica

Očištění dat

  • Validace dat
  • Zpracování chybějících pozorování
  • Zpracování odlehlých pozorování

Úpravy dat

  • Standardizace
  • Transformace, dávková transformace
  • Překódováni
  • Tvorba nových proměnných pomocí vzorců
  • Přeskupování a seskupování
  • Filtrace

Vzorkování

Praktické zkušenosti

  • Běžné postupy
  • Na co si dávat pozor

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.

Předchozí kurzy

Tento kurz může doplnit znalosti z kurzů:

Základní kurz statistiky I či Praktická analýza dat. Pro absolvování nicméně tyto kurzy nejsou nutné.

Předzpracování dat je také velmi důležité pro oblast data miningu, tedy pro kurzy:

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Navazující kurzy

Navazujícím kurzem může být kterýkoli kurz zaměřující se na statistické metody.

Ať už je to:

Základní kurz statistiky IIAnalýza rozptylu,

či další.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro profesionály

Regresní analýza

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Regresní analýza je jednou z nejpoužívanějších a nejrozšířenějších statistických metod vůbec. Jednodenní kurz je zaměřen zejména na modely lineární a nelineární regrese. Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech.

Cílová skupina

  • Kurz je vhodný pro všechny, kteří chtějí nebo potřebují analyzovat data pomocí regresní analýzy, tedy chtějí vyšetřovat závislost spojité veličiny na základě dalších spojitých veličin.
  • Kurz je vhodný pro ty, kteří chtějí doplnit teoretické znalosti o této metodologii.
  • Regresní analýza je univerzální metodou, prakticky tedy nelze říct, že by kurz byl vhodnější pro nějakou konkrétní oblast nebo výčet oblastí.
  • Ti, kteří se potřebují naučit, jak provést výše zmíněné typy regrese v softwaru TIBCO Statistica.

Cíle kurzu

  • Posluchač bude seznámen s úlohou regresní analýzy.
  • Naučit se ověřovat předpoklady použití regresního modelu.
  • Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do regresní analýzy

Lineární regresní modely

  • Ověření předpokladů
  • Jednoduchá regrese
  • Vícenásobná regrese
  • Polynomiální regrese (určení stupně polynomu)

Nelineární regresní modely

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Základní kurz statistiky I nebo Statistika v lékařství I.

Navazující kurzy

Tématiku regresních modelů pro jiné než spojité veličiny je možné doplnit kurzy:

Analýza rozptylu,

Logistická, ordinální a multinomická regrese.

 

Možností, jak řešit regresní úlohu je více, mohou pomoci například dataminingové metody:

Klasifikační a regresní stromy,

Neuronové sítě nebo

Data mining (dvoudenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro profesionály

Vícerozměrné statistické metody

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Dvoudenní kurz poskytne účastníkům přehled metod využívaných při explorativní analýze dat. Použitelnost těchto metod je velmi široká, sociálními vědami počínaje a hospodářstvím či marketingem konče. Všechny probírané metody (viz program kurzu) budou procvičeny na příkladech.

Účastníci si tak osvojí nejen znalost principů, ale i dovednost uplatnit metody v praxi. Kurz je rovněž vhodný pro uživatele systému STATISTICA, kteří se chtějí podrobněji seznámit s modulem STATISTICA Vícerozměrné průzkumné techniky.

Cílová skupina

  • Všichni, kteří potřebují zpracovávat vícerozměrná data.
  • Ti, kteří potřebují prohloubit své znalosti v oblasti diskriminační analýzy, tvorby shluků, predikování kategorické proměnné, hledání vztahů mezi skupinami proměnných apod.

Cíle kurzu

  • Naučit se teoretické i praktické využití vícerozměrných statistických metod.

Osnova

Úvod

  • Základní informace o softwaru STATISTICA
  • Výukové zdroje pro software a možnosti nápovědy

Analýza hlavních komponent (Principal Component Analysis)

Faktorová analýza (Factor Analysis)

Shluková analýza (Cluster Analysis)

Diskriminační analýza (Discriminant Analysis)

Kanonická korelace (Canonical Correlation Analysis)

Vícerozměrné škálování (Multidimensional Scaling)

Klasifikační stromy (Classification Trees)

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Základní znalost principů statistického uvažování či absolvování Základního kurzu statistiky I(kurz Vícerozměrné statistické metody je jeho vhodným rozšířením). Není ale podmínkou. Vhodný pro prohloubení znalostí vícerozměrných metod z kurzu Základní kurz statistiky II.

Předchozí kurzy

Vhodné je absolvovat tento kurz, nicméně není podmínkou:

Základní kurz statistiky I.

Také účastníci kurzu Základní kurz statistiky II mohou kurzem vícerozměrných metod rozšířit své znalosti.

Navazující kurzy

Kurzem pro další studium řešení podobných úloh může být kurz:

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Základní kurz statistiky I

2
Zelený Pruh 95/97, Praha 4
12400,- Kč bez DPH

Základní kurz statistiky I Vám zprostředkuje pohled do světa statistických analýz. Cílem kurzu je naučit se efektivně získávat informace z dat a porozumět filozofii statistického zpracování dat. V úvodu jsou účastníci seznámeni s principy používání programu TIBCO Statistica, obsluhou jeho jednotlivých nástrojů a vybranými vhodnými funkcemi a vlastnostmi. Podrobněji budou vysvětlena témata popisná statistika, principy statistického usuzování a interpretace výsledků. Druhá část kurzu se věnuje statistickému rozhodování a vyšetření závislosti mezi proměnnými. Pro snazší pochopení dané problematiky budou v průběhu kurzu řešeny úlohy na reálných datech. Důraz je kladen na interpretaci výsledků a grafické možnosti systému TIBCO Statistica.

Kurz je určen zejména pro ty, kteří se statistickou analýzou dat začínají. Převážná část kurzu je věnována statistickému testování hypotéz (komparativní, párový pokus) parametrickými i neparametrickými testy, je proto vhodný také pro vědecké pracovníky, kteří si potřebují své postupy ujasnit/ potvrdit.

Cílová skupina

  • Úplné začátečníky v oblasti zpracování dat.
  • Všechny, kteří chtějí porozumět statistickému zpracování dat.
  • Vědečtí pracovníci, kteří si chtějí ujasnit své postupy.
  • Ti, kteří si potřebují vyhodnotit data z dotazníkových šetření.
  • Ekonomické pracovníky, kteří chtějí efektivně využívat zákaznická data (najít závislosti, pokročilou vizualizaci apod.)

Cíle kurzu

  • Pomoci začít s analýzami i úplným začátečníkům.
  • Naučit se dělat grafy pro různé typy dat.
  • Naučit porovnávat 2 skupiny (experimentální / kontrolní).
  • Pochopit rozdíl mezi párovým a nepárovým pokusem
  • Naučit se porovnávat více než 2 skupiny
  • Naučit se kvantifikovat závislosti mezi proměnnými (korelace, kontingence...)
  • Naučit se vytvářet modely typu „Co se stane, když…“
  • Naučit zpracovávat samostatně svá data v softwaru Dell Statistica pomocí odučených metod.

Osnova

  • Úvod
  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy
  • Základy obsluhy programu TIBCO Statistica
  • Seznámení s prostředím TIBCO Statistica
  • Načtení dat, různé typy výstupů
  • Vytvoření nové tabulky dat, vkládání a upravování dat
  • Možnosti grafických výstupů
  • Úvod do analýzy dat
    • Co je to statistická analýza dat
  • Popisná statistika
  • Typy rozdělení proměnných
  • Charakteristiky polohy a variability
  • Vhodná vizualizace dat
  • Vztah dvou veličin
  • Normální rozdělení a ověření normality dat
  • Testování hypotéz
  • Úvod do testování hypotéz
  • Jednotlivé kroky testování hypotéz, interpretace výsledků
  • Vybrané statistické metody
  • Přehled některých základních testů a příklady jejich použití
  • Test nezávislosti dvou kategoriálních znaků, t-testy, analýza rozptylu, základní neparametrické testy, korelační analýza, lineární regrese

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. .

Předchozí kurzy

Pokud se chce posluchač plně soustředit na teorii, pak je výhodné před tímto kurzem absolvovat kurz:

Ovládání programu Statistica.

Navazující kurzy

Navazujícím kurzem pro komplexní obecné vzdělávání je:

Základní kurz statistiky II.

 

Pokud si chcete rozšířit znalosti konkrétní problematiky, pak je pro Vás k dispozici celá řada specializovaných kurzů jako jsou:

Analýza rozptylu,

Regresní analýza,

Neparametrická statistika,

Analýza kategoriálních dat,

Vícerozměrné statistické metody,

Časové řady a predikce.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Obecná analýza dat
  • Pro všechny

Základní kurz statistiky II

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Kurz je zaměřen zejména na obecné lineární modely (vícerozměrná regrese, analýza rozptylu) a na možnosti nelineárního modelování. Všechny probírané metody jsou procvičeny na konkrétních příkladech, vše s důrazem na praktické použití daných metod a interpretaci výsledků. Kurz je rovněž vhodný pro uživatele systému TIBCO Statistica, kteří se chtějí podrobněji seznámit s modulem STATISTICA Pokročilé lineární a nelineární modely.

Cílová skupina

  • Zájemce, kteří si chtějí rozšířit své základní statistické vzdělání.
  • Absolventi kurzu Základní kurz statistiky I či Statistika v lékařství I.
  • Všechny, kteří chtějí porozumět statistickému zpracování dat.
  • Vědečtí pracovníci, kteří si chtějí ujasnit své postupy.

Cíle kurzu

  • Rozšířit si své Naučit se základní postupy, jak správně předpřipravit svá data pro analýzu.
  • Naučit se vytvářet modely typu „Co se stane, když…“, tedy regresní metody pro nejrůznější situace.
  • Získat přehled v úlohách regresních, úlohách analýzy rozptylu a vícerozměrných metodách.
  • Naučit zpracovávat samostatně svá data v softwaru TIBCO Statistica pomocí odučených metod.

Osnova

Úvod

  • Základní informace o softwaru STATISTICA
  • Výukové zdroje pro software a možnosti nápovědy

Zpracování a příprava dat

  • Filtrování
  • Zpracování chybějících dat

Regresní analýza

  • Korelační analýza
  • Lineární regresní modely
  • Nelineární regresní modely
  • Logistická regrese
  • Analýza kovariance

Analýza rozptylu

  • Vícefaktorová ANOVA
  • ANOVA pro opakovaná měření
  • Vícerozměrná analýza rozptylu (MANOVA)

Úvod do vícerozměrných statistických metod

  • (podrobně probíráno v rámci kurzu Vícerozměrné statistické metody)

Úvod do časových řad

  • (podrobně probíráno v rámci kurzu Časové řady a predikce)

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows, kurz volně navazuje na Základní kurz statistiky I. Absolvování Základního kurzu statistiky I není podmínkou.

Předchozí kurzy

Vhodné je absolvovat následující kurz, nicméně to není podmínkou:

Základní kurz statistiky I.

Navazující kurzy

Navazujícími kurzy mohou být například kurzy, které rozšiřují a doplňují znalosti nabyté v tomto kurzu:

Vícerozměrné statistické metody,

Časové řady a predikce,

Analýza rozptylu,

Regresní analýza, Logistická, multinomická a ordinální regrese.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Specializované kurzy
  • Pro profesionály

Statistika ve společenských vědách

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Kvalitativní a ordinální data jsou součástí téměř každého kvantitativního výzkumu ve společenských vědách, kde data jsou vesměs získávána pomocí dotazníkových šetření nejrůznějšího typu. Kvalitativní data jsou zde typicky výsledkem dotazníkového šetření s “multiple choice” položkami, k ordinálním datům potom vedou např. šetření s Likertovými položkami. Ve své první části si dvoudenní kurz Statistika ve společenských vědách klade za cíl seznámit účastníky s klasickými metodami statistické analýzy takovýchto dat. Na programu budou nejprve metody popisné statistiky, jejichž použití je smysluplné v kontextu kvalitativních a ordinálních dat. Následně se zaměříme na metody umožňující vyhodnotit statistickou odlišnost mezi dvěma či více skupinami vzhledem ke kvalitativní, resp. ordinální odezvě. Například v kontextu pedagogického výzkumu budeme poté schopni vyhodnotit, zda existují průkazné rozdíly mezi výsledky žáků na školách různého typu (např. víceletá gymnázia a druhý stupeň základních škol). Dále se budeme zabývat metodami pro párová kvalitativní a ordinální data, které nám umožní vyhodnotit kupříkladu vliv intervence (změna učebního postupu, …) na odezvu (studijní výsledky).

Nevhodně či dokonce špatně sestavené dotazníkové šetření může vést ke zcela nepoužitelným datům, proto se budeme věnovat také položkové analýze dotazníkového šetření, která umožní posoudit míru vnitřní konzistence jednotlivých položek dotazníku.

Druhá hlavní část kurzu bude věnována zejména metodám statistické analýzy vícerozměrných dat. V kontextu kvantitativního výzkumu ve společenských vědách je často zjišťováno nemalé množství proměnných, kdy cílem je zjistit vazby mezi jednotlivými proměnnými současně. V první řadě se seznámíme s metodami, které umožní v přehledné formě reprezentovat či vizualizovat sesbíraná data. Půjde zejména o analýzu hlavních komponent, faktorovou analýzu, korespondenční analýzu, či vícerozměrné škálování. Soustředíme se také na vyhodnocení síly vztahu mezi dvěma skupinami proměnných pomocí kanonických korelací, které lze považovat za vícerozměrnou analogii klasického korelačního koeficientu. Nebude chybět také seznámení s metodami, pomocí nichž lze provádět klasifikaci jednotek (případů) na základě vícerozměrných dat. Půjde zejména o klasické metody diskriminační a shlukové analýzy a klasifikačních stromů.

Všechny metody budou ilustrovány na analýzách dat z různých společensko-vědních oborů pomocí modulů software TIBCO Statistica. Cílem je zejména vytvořit u účastníků kurzu dobrou představu o použití jednotlivých metod.

Cílová skupina

  • Z názvu kurzu je patrné, že kurz je ušit na míru potřebám výzkumníků z oblasti společenských věd.
  • Výzkumní pracovníci, kteří zpracovávají data z dotazníkových šetření.
  • Ti, kteří mají k dispozici vícerozměrná data a potřebují je statisticky zpracovávat.
  • Kurz je vhodný pro ty, kteří chtějí doplnit své teoretické znalosti o této metodologii.

Cíle kurzu

  • Vytvořit účastníkům dobrou představu o použití jednotlivých metod.
  • Naučit posluchače zpracovávat data z dotazníkových šetření a poznat, že je dotazník nevhodně sestaven.
  • Naučit hodnotit statistickou odlišnost mezi dvěma a více skupinami vzhledem ke kvalitativní odezvě.
  • Seznámit s vícerozměrnými statistickými metodami a jejím využitím.
  • Dokázat vyhodnotit svá data samostatně v softwaru TIBCO Statistica.

 Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Metody pro kvalitativní a ordinální data

  • Popisná statistika
  • Srovnání dvou či více skupin
  • Metody pro párová data

Položková analýza dotazníkových šetření

  • Cronbachovo alfa

Vícerozměrné statistické metody

  • Vizualizace
  • Analýza hlavních komponent
  • Faktorová analýza
  • Kanonické korelace
  • Korespondenční analýza
  • Mnohorozměrné škálování

Klasifikační metody

  • Diskriminační analýza
  • Shluková analýza
  • Klasifikační stromy

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Znalost základů statistického uvažování (přibližně v rozsahu kurzu Základní kurz statistiky I).

Předchozí kurzy

Vhodné je absolvovat Základní kurz statistiky I.

Navazující kurzy

Účastníky mohou zajímat kurzy:

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Specializované kurzy
  • Pro profesionály

Statistika v lékařství I

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Tento dvoudenní kurz je určen všem těm, kteří ve své výzkumné či jiné práci s medicínským zaměřením potřebují provádět jednodušší statistické analýzy. Na konkrétních příkladech s lékařskou tématikou budou postupně probrány statistické metody, které bývají náplní jednosemestrálních přehledových kurzů biostatistiky na lékařských fakultách či vysokých školách přírodovědného zaměření. Zatímco v těchto kurzech je důraz často kladen na matematické detaily jednotlivých statistických postupů, hlavním cílem našeho kurzu je zaměřit se na získání dovednosti identifikovat pro konkrétní problém správnou statistickou metodu a po jejím provedení pomocí software TIBCO Statistica následně správně interpretovat její výsledky.

Cílová skupina

  • Kurz je svým zaměřením i praktickými příklady určen především pro ty, kteří pracují v medicínských zařízeních.
  • Začínající výzkumníky, kteří se chtějí dozvědět, jak analyzovat data.
  • Úplní začátečníci v oblasti zpracování dat.
  • Výzkumní pracovníci, kteří potřebují statisticky zpracovat výsledky svých studií či měření.
  • Výzkumní pracovníci, kteří si chtějí ověřit správnost svých postupů při zpracování dat.

Cíle kurzu

  • Seznámit se se základními statistickými metodami (přibližně v rozsahu jednosemestrálních přehledových kurzů biostatistiky).
  • Naučit se aplikovat správnou metodu na daná data.
  • Naučit se interpretovat výsledky statistických analýz.
  • Umět si samostatně zpracovat probírané analýzy v softwaru TIBCO Statistica.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Základní statistické pojmy, využití statistiky v medicíně

Popisná statistika pro kvalitativní data, jejich grafická prezentace

Popisná statistika vhodná při zkoumání závislosti mezi dvěma znaky (proměnnými)

  • Míry závislosti (korelace, ...)

Základní pojmy statistické inference

  • Odhad, test, chyba I. druhu, P-hodnota, síla, …

Porovnání dvou či více skupin vzhledem ke kvalitativnímu znaku

  • Srovnání proporcí
  • Chí-kvadrát test
  • McNemarův test, ...

Porovnání dvou či více skupin vzhledem ke kvantitativnímu znaku

  • Studentův t-test
  • Wilcoxonův test
  • Analýza rozptylu
  • Kruskalův-Wallisův test, …

Základy lineární regrese

Shrnutí

Předpoklady účastníka

Předchozí kurzy

Doporučujeme před kurzem absolvovat kurz Ovládání programu Statistica, aby se posluchač mohl plně soustředit na probíranou teorii.

Navazující kurzy

Nejvhodnějším kurzem je přímo navazující kurz

  • Statistika v lékařství II.

Dalšími kurzy, které mohou pomoci s analýzou v sektoru lékařství, jsou:

  • Analýza rozptylu
  • Analýza síly testu
  • Analýza přežití
  • Analýza kategoriálních dat
  • Logistická, ordinální a multinomická regrese

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Specializované kurzy
  • Pro profesionály

Statistika v lékařství II

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Kurz je pokračováním statistiky v lékařství. Je určen pro lékaře a další zájemce s podobným zaměřením, kteří potřebují ke své práci analýzu dat. Účastníci kurzu se seznámí s pokročilejšími statistickými technikami používanými v lékařství. V závěru kurzu je i úvod do metodologie, která je potřeba pro psaní odborných článků a využití nástrojů medicíny založené na důkazech.

Cílová skupina

  • Kurz je svým zaměřením i praktickými příklady určen především pro ty, kteří pracují v medicínských zařízeních.
  • Absolventi kurzu Statistika v lékařství I nebo Základního kurzu statistiky I.
  • Ti, kteří potřebují rozšířit své znalosti v oblasti statistického zpracování dat.
  • Výzkumní pracovníci, kteří si chtějí ověřit správnost svých postupů při zpracování dat.
  • Výzkumní pracovníci, kteří potřebují statisticky zpracovat výsledky svých studií či měření.

Cíle kurzu

  • Seznámit se s pokročilejšími statistickými metodami, které se používají v oblasti lékařství.
  • Naučit se aplikovat správnou metodu na daná data.
  • Naučit se interpretovat výsledky statistických analýz.
  • Umět si samostatně zpracovat probírané analýzy v softwaru TIBCO Statistica.

Osnova

  • Úvod
    • Základní informace o softwaru TIBCO Statistica
    • Výukové zdroje pro software a možnosti nápovědy
  • Základy pravděpodobnosti
  • Vícenásobná regrese
  • Zobecněné lineární modely
    • Logistická regrese
    • Poissonovská regrese
    • Log-lineární modely
  • Ohodnocení binárních diagnostických procedur
    • Bayesův vzorec
    • Incidence, prevalence, senzitivita, specificita
    • Pozitivní a negativní prediktivní hodnota
    • ROC křivka
    • Plocha pod křivkou (AUC).
  • Základy analýzy přežití
    • Kaplanův-Meierův odhad funkce přežití
    • Logrankový dvouvýběrový test
    • Coxův model
    • Parametrický AFT model
  • Základní typy statistických studií používaných v lékařství
    • Průřezová studie
    • Pozorovací studie
    • Klinické pokusy, …
  • Úvod do metaanalýz
    • Medicína založená na důkazech (evidence-based medicine)

Předpoklady účastníka

  • Znalosti v rozsahu kurzu Základní kurz statistiky I nebo Statistiky v lékařství I.

Předchozí kurzy

Pro tento kurz je potřeba mít znalosti v rozsahu kurzu Základní kurz statistiky I nebo Statistiky v lékařství I. Výhodné je také mít za sebou kurz Ovládání programu Statistica.

Navazující kurzy

Dalšími kurzy, které mohou pomoci s analýzou v sektoru lékařství a rozšíří nabyté znalosti, jsou:

Analýza rozptylu,

Analýza síly testu,

Analýza přežití,

Analýza kategoriálních dat,

Logistická, ordinální a multinomická regrese.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Specializované kurzy
  • Pro všechny

Základy statistiky pro průmysl

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Je známým faktem, že aplikace statistických metod v procesu výroby vede ke snížení variability měřených parametrů a zefektivnění výroby, a proto je tento kurz je pro Vás dobrým začátkem. Kurz je určen všem, kteří chtějí používat statistické metody v oblasti řízení kvality a průmyslu vůbec. Cílem dvoudenního kurzu je seznámit se od základu s filozofií statistického zpracování dat v průmyslu, důraz je také kladen na grafické možnosti systému TIBCO Statistica.

Cílová skupina

  • Úplní začátečníci
  • Všichni, kteří chtějí porozumět statistickému zpracování dat a to především ty z oblasti výroby
  • Pracovníci výroby, kteří potřebují pravidelně/nepravidelně vyhodnocovat svá data
  • Pracovníci, kteří potřebují najít vlivné faktory na sledovaný parametr (například z výroby)
  • Pracovníci, kteří potřebují zpracovávat obchodní data (najít závislosti, pokročilou vizualizaci apod.)
  • Pracovníci, kteří potřebují začít s analýzou dat.

Cíle kurzu

  • Seznámit s filozofií statistického zpracování dat v průmyslu.
  • Naučit se vhodně vizualizovat data.
  • Naučit se předpřipravit data pro analýzu.
  • Naučit se základní statistické metody.
  • Naučit se pracovat v softwaru TIBCO Statistica.

Osnova

  • Úvod
    • Základní informace o softwaru TIBCO Statistica
    • Výukové zdroje pro software a možnosti nápovědy
  • Základy obsluhy programu TIBCO Statistica
    • Seznámení s prostředím TIBCO Statistica
    • Načtení dat, různé typy výstupů, získání dat z databáze
    • Možnosti grafických výstupů
  • Kontrola kvality dat
    • Čištění dat
    • Odlehlé hodnoty
  • Porozumění datům
    • Box-Coxova transformace
    • Paretova analýza
  • Úvod do analýzy dat
    • Co je to statistická analýza dat
    • Hlavní myšlenka statistické analýzy dat
  • Popisná statistika
    • Typy rozdělení proměnných
    • Číselné charakteristiky rozdělení proměnných, grafické znázornění
    • Normální rozdělení a ověření normality dat
  • Testování hypotéz
    • Úvod do testování hypotéz
    • Jednotlivé kroky testování hypotéz, interpretace výsledků
  • Vybrané statistické metody
    • Přehled některých základních testů a příklady jejich použití
    • Korelační analýza
    • Základní regulační diagramy
    • Úvod do časových řad

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.

Předchozí kurzy

Tento kurz je úvodním kurzem do problematiky.

Navazující kurzy

Účastníky mohou zajímat kurzy:

Základy Lean Six Sigma,

Six Sigma Green Belt.

 

Pokročilé úlohy z průmyslového prostředí se dají řešit skrz data mining, tedy

Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).

 

Pokud může automatizace postupů zjednodušit některé z procesů,pak je vhodné absolvovat kurz:

Data mining v praxi v prostředí Workspace (je samostatně nebo součástí kurzu Data mining (třídenní varianta)).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Data Mining
  • Pro všechny

Data Mining v praxi v prostředí Workspace

1
Zelený Pruh 95/97, Praha 4
5490,- Kč bez DPH

Tento jednodenní trénink je buď součástí kurzu Data mining (třídenní varianta) nebo ho lze absolvovat zvlášť jako jednodenní školení (tato varianta je vhodná především pro ty, kteří absolvovali kurz Data mining již dříve).

Prostředí pracovní plochy Workspace je uživatelské rozhraní, ve kterém je možné jednoduše a efektivně zpracovat a vizualizovat složitější pracovní postupy. I bez znalosti programovacích jazyků lze pomocí propojování uzlů (které představují jednotlivé analýzy a funkcionality, které již z programu Statistica znáte) naprogramovat kompletní a posléze automaticky spustitelnou analýzu. Také proto je toto prostředí primárně určeno pro data mining, využitelné je nicméně ve všech oblastech zpracování dat. Předpokládá se, že se toto uživatelské rozhraní díky svým vlastnostem stane postupem času primárním ovládacím prostředím programu.

Hlavní náplní kurzu jsou praktické ukázky a příklady úloh z oblasti data miningu či úloh, kde je možné výhodně využít funkcionality prostředí Workspace. Účastníci si budou během kurzu postupy sami zkoušet a tvořit spolu s lektorem na svém počítači.

Cílová skupina

  • Absolventi kurzu Data mining, jelikož tento kurz skvěle doplňuje a zužitkovává znalosti z tohoto kurzu.
  • Ti, kteří se chtějí seznámit a naučit se s prostředím Workspace.
  • Ti, kteří potřebují automatizovat své analytické pracovní postupy (a to bez nutnosti znát jakýkoli programovací jazyk).

Cíle kurzu

  • Vysvětlit výhody používání prostředí Workspace a motivovat posluchače k jeho budoucímu používání.
  • Naučit posluchače efektivně využívat prostředí Workspace.
  • Ukázat reálné příklady a typické úlohy, které lze prostředím Workspace velmi efektivně řešit.
  • Seznámit s dalšími možnostmi, jak lze posunout automatizaci analýz ještě dále.

Osnova

Úvod

  • Představení prostředí Workspace

Obsluha prostředí Workpace

  • Filozofie tohoto uživatelského rozhraní
  • Vlastnosti uzlů
  • Tématické skupiny uzlů
  • Rozdíl mezi skriptovanými a „novými“ uzly a využití této rozdílnosti v různých situacích
  • Speciální uzly

Praktické aplikace

  • Načítání dat z více datových zdrojů
  • Čištění a úprava dat
  • Workspace pro automatické reportování
  • Tvorba predikčních modelů
  • Porovnání kvality více modelů
  • Nasazení vytvořených modelů na nová data
  • Spouštění workspace ze Statistica Enterprise

Customizace a usnadnění práce

  • Přednastavené úlohy
  • Tvorba vlastní nabídky uzlů
  • Customizace vytvořených uzlů
  • Tvorba vlastních uzlů

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows. Kurz čerpá a navazuje na poznatky kurzu Data mining (dvoudenní varianta), proto jej doporučujeme před tímto kurzem absolvovat. Vhodné je také mít základní znalosti funkcionalit programu Statistica.

Předchozí kurzy

Kurz částečně čerpá ze znalostí kurzu

Data mining (dvoudenní varianta)

Výhodné, ale ne nutné  je také absolvovat kurz:

Ovládání programu Statistica.

Navazující kurzy

Prostředí Workspace může být vnímáno a používáno jako nástroj pro programování. V případě, že potřebujete detailněji programovat své vlastní funkcionality a aplikace, můžeme doporučit kurz Statistica Visual Basic.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Data Mining
  • Pro všechny

Data Mining (dvoudenní varianta)

2
Zelený Pruh 95/97, Praha 4
13900,- Kč bez DPH

Tento dvoudenní kurz je určen osobám, které chtějí odhalit informace a znalosti ukryté v datech. Cílem tohoto kurzu není ukázat jen vhodné postupy, ale také způsob, jak co nejlépe prezentovat výsledky. V průběhu kurzu budou prezentovány nejrůznější techniky: korelační analýza, regresní analýza, časové řady, klasifikační stromy, neuronové sítě a další. Na závěr budou ukázány konkrétní příklady z oblasti vytěžování dat. V průběhu celého kurzu budou účastníci pracovat s modulem Statistica Data Miner.

Cílová skupina

  • Analytik, statistik či datový specialista, který potřebuje zpracovávat rychle velké objemy dat.
  • Zájemce o problematiku data miningu (dolování informací z dat).
  • Typickými posluchači mohou být analytici z oblasti bankovnictví, pojišťovnictví, ale také pokročilí analytici z oblasti průmyslu.
  • Ti, kteří se chtějí seznámit s modulem Data Miner v softwaru TIBCO Statistica.

Cíle kurzu

  • Seznámit se teoreticky, ale i prakticky s množstvím metod spadajících do oblasti data miningu.
  • Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
  • Naučit se pracovat v několika unikátních prostředích TIBCO Statistica určených přímo pro data mining.
  • Naučit se používat modul Data Miner.

Osnova

Úvod

  • Základní informace o softwaru Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do vytěžování dat, produkt

  • Princip, možnosti, využití

Práce s recepty (wizardem)

  • Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
  • Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
  • Výběr důležitých prediktorů pro požadovanou úlohu
  • Vytváření klasifikačních a regresních modelů
  • Vyhodnocení kvality vytvořeného modelů
  • Nasazení modelu v praxi

Klasifikační a regresní stromy

  • Princip, možnosti, využití
  • CART stromy
  • CHAID stromy
  • Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)
  • Generované stromy (Boosted Trees)
  • Náhodné lesy (Random Forests)

Lineární modely

  • Princip regrese
  • (Obecné) lineární modely
  • Zobecněné lineární modely
  • Zobecněné aditivní modely
  • MARSplines

Metody shlukování

  • K-průměrů (k-means)
  • Hierarchické a EM shlukování

Automatizované neuronové sítě

  • Princip umělých neuronových sítí, základní typy (MLP, RBF, Kohonenova síť)
  • Automatizovaný a vlastní návrh sítě

Metody strojového učení

  • Bayesův klasifikátor
  • SVM
  • k-NN klasifikátor

Analýza nezávislých komponent (ICA)

Text Mining

  • Účel, princip a zdroje text miningu
  • Vytvoření a práce s indexovým souborem
  • Asociační pravidla a sekvence

Nasazení modelů na reálná data z praxe

Kvalita získaných modelů

  • Korelační analýza
  • ROC křivka
  • Grafy zisku a navýšení (Gains/Lift cart)

Metody výběru vhodných příznaků

Sdružování rozsáhlých skupin hodnot příznaků (Binning)

Základy práce v pracovní ploše (Workspaces)

  • Práce s uzly
  • Využití přednastavených úloh (zejména pro klasifikaci a regresi)
  • Pro detailnější seznámení s tímto prostředím doporučujeme absolvovat třídenní verzi kurzu Data mining, který je sloučením tohoto dvoudenního kurzu a kurzu Data mining v praxi v prostředí Workspace

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows, doporučujeme před tímto kurzem absolvovat Základní kurz statistiky I.

Předchozí kurzy

Doporučujeme před tímto kurzem absolvovat kurz:

Základní kurz statistiky I.

Navazující kurzy

Spolu s dvoudenním kurzem Data mining doporučujeme absolvovat i kurz Data mining v praxi v prostředí Workspace.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Data Mining
  • Pro všechny

Data Mining (třídenní varianta)

3
Zelený Pruh 95/97, Praha 4
17900,- Kč bez DPH

Tento třídenní kurz je balíčkem kurzů Data mining (dvoudenní varianta) a Data mining v praxi v prostředí Workspace. V prvních dvou dnech se dozvíte o využití a pozadí data miningových metod, ve třetím dni se pak naučíte pracovat v prostředí pracovní plochy Workspace, která je nejvhodnějším uživatelským rozhraním pro zpracovávání dataminingových úloh. Nabyté znalosti Vám usnadní praktickou aplikaci data miningu na Vaše data a ukáží opravdovou sílu modulu Statistica Data Miner.

Cílová skupina

  • Analytik, statistik či datový specialista, který potřebuje zpracovávat rychle velké objemy dat.
  • Zájemce o problematiku data miningu (dolování informací z dat).
  • Typickými posluchači mohou být analytici z oblasti bankovnictví, pojišťovnictví, ale také pokročilí analytici z oblasti průmyslu.
  • Ti, kteří se chtějí seznámit s modulem Data Miner v softwaru TIBCO Statistica.

Cíle kurzu

  • Seznámit se teoreticky, ale i prakticky s množstvím metod spadajících do oblasti data miningu.
  • Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
  • Naučit se pracovat v několika unikátních prostředích TIBCO Statistica určených přímo pro data mining.
  • Naučit se používat modul Data Miner.
  • Naučit se používat prostředí Workspace,

Osnova

Pro kompletní program kurzu se prosím podívejte na stránky kurzů Data mining (dvoudenní varianta) a Data mining v praxi v prostředí workspace. Tento kurz je spojením obou kurzů.

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows, doporučujeme před tímto kurzem absolvovat Základní kurz statistiky I.

Předchozí kurzy

Doporučujeme před tímto kurzem absolvovat kurz:

Základní kurz statistiky I.

Výhodné je také absolvovat kurz:

Ovládání programu Statistica.

Navazující kurzy

Navázat můžete podle oboru a povahy problému, který zkoumáte, nějaký univerzální navazující kurz není k dispozici.

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Data Mining
  • Pro profesionály

Klasifikační a regresní stromy

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Rozhodovací stromy jsou jednou z nejpoužívanějších technik data miningu. Kurz je určen těm, kteří se zajímají o klasifikaci dat (například credit scoring, kdy se na základě příznaků snažíme rozhodnout o zařazení vzorů do skupin) nebo se věnují regresním úlohám včetně predikcí časového vývoje. Kurz seznámí účastníky nejen s klasickými metodami, ale i s pokročilejšími stromovými strukturami jako jsou Boosting Trees nebo Random Forests. Součástí kurzu je i interaktivní tvorba vlastních stromů a jejich modifikace.

Cílová skupina

  • Statistici, datoví specialisté či analytici, kteří potřebují řešit úlohu predikce kategorií či predikci nějaké spojité veličiny na základě dalších atributů.
  • Klasifikační stromy jsou typickou metodou používanou v bankovnictví a pojišťovnictví.
  • Nejtypičtější úlohou je využití v oblasti credit scoring.

Cíle kurzu

  • Porozumět metodologii stromovitých algoritmů.
  • Dokázat vytvořit a interpretovat model pro predikci.
  • Dokázat si vyhodnotit, který model vybrat jako finální pro nasazení do procesu predikce.
  • Naučit se analyzovat data těmito metodami v softwaru TIBCO Statistica.
  • Seznámit se s prostředím Statistica Data Miner

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Příprava dat STATISTICA

  • Načtení, transformace, vzorkování, filtrace odlehlých hodnot, oprava chybějících údajů, atd.

Výběr důležitých prediktorů pro požadovanou úlohu

Sdružování rozsáhlých skupin hodnot příznaků (binning)

Klasifikační a regresní stromy

  • Vytváření, princip, možnosti, využití

Metody

  • Klasifikační a regresní stromy CART
  • CHAID
  • Generované stromy (Boosted Trees)
  • Náhodné lesy (Random Forests)
  • Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)

Vyhodnocení kvality vytvořeného modelu

  • Korelační analýza
  • ROC křivka
  • Grafy zisku a navýšení (Gains a Lift chart)

Nasazení modelu v praxi

Hierarchické shlukování a jeho souvislost s klasifikačními a regresními stromy

Základy práce v prostředí modulu Statistica Data Miner

  • Práce s recepty (wizardem)
  • Práce v rámci pracovní plochy (workspaces)
  • Využití přednastavených úloh
  • Implementace vlastních uzlů

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.

Navazující kurzy

Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:

Data mining v praxi v prostředí Workspace.

Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro klasifikační a regresní stromy, pak doporučujeme kurzy:

Neuronové sítě,

Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Data Mining
  • Pro profesionály

Neuronové sítě

2
Zelený Pruh 95/97, Praha 4
12900,- Kč bez DPH

Neuronové sítě patří mezi oblíbené moderní techniky, které umožňují nový a často i efektivnější přístup pro zpracování dat. Dvoudenní kurz umožňuje seznámení jak s teoretickými principy fungování neuronových sítí, tak s jejich praktickou aplikací prostřednictvím modulu STATISTICA Automatizované neuronové sítě. Kurz poskytne přehled o architektuře neuronových sítí a metodách učení. Postup, jak dosáhnout pomocí neuronových sítí co nejlepších výsledků, bude demonstrován při řešení praktických úloh.

Cílová skupina

  • Analytik, statistik či datový specialista, který potřebuje zpracovávat velké objemy dat.
  • Zájemce o problematiku neuronových sítí.
  • Ti, kteří mají v datech složité nelineární závislosti a chtějí i přes to tvořit modely pro predikci či klasifikaci.
  • Typickými posluchači mohou být analytici například z oblasti průmyslu, či specializovaných oblastí medicíny.
  • Ti, kteří se chtějí seznámit s modulem neuronových sítí v softwaru TIBCO Statistica.

Cíle kurzu

  • Seznámit se teoreticky, ale i prakticky s podstatou modelování pomocí neuronových sítí.
  • Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
  • Ukázat, jaké možnosti má v této oblasti software TIBCO Statistica.
  • Účastníci se také naučí pracovat v prostředích Receptů a částečně také v prostředí Workspace.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Práce s recepty (wizardem)

  • Princip, možnosti, využití

Práce s recepty (wizardem)

  • Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
  • Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
  • Výběr důležitých prediktorů pro požadovanou úlohu
  • Vytváření klasifikačních a regresních modelů
  • Vyhodnocení kvality vytvořeného modelů
  • Nasazení modelu v praxi

Principy neuronových sítí

  • Neuron, model neuronu
  • Základní typy sítí (MLP, RBF Kohonenova)
  • Struktura neuronové sítě, princip učení, reprezentace znalostí

Práce s neuronovými sítěmi

  • Rozdělování dat na trénovací, validační a testovací množiny, bootstrapping, křížová validace
  • Nastavení parametrů sítí (počet vrstev, neuronů, typy neuronů, post-synaptické funkce, aktivační funkce, algoritmy učení – backpropagation, problém lokálního minima, heuristiky a další)
  • Automatizovaný a vlastní návrh sítě

Využití neuronových sítí

  • Klasifikace
  • Regrese
  • Analýza časových řad
  • Shluková analýza pomocí Kohonenovy neuronové sítě (SOM)

Metody výběru vhodných příznaků

Sdružování rozsáhlých skupin hodnot příznaků (binning)

Vyhodnocení kvality vytvořeného modelu

  • Korelační analýza
  • ROC křivka
  • grafy zisku a navýšení (Gains a Lift chart)

Nasazení modelu v praxi

Práce v prostředí modulu STATISTICA Data Miner

  • Práce v rámci pracovní plochy (workspaces)
  • Využití přednastavených úloh
  • Implementace vlastních uzlů

Předpoklady účastníka

Běžná obsluha počítače v prostředí Windows

Předchozí kurzy

Není nutné absolvovat před tímto kurzem jiné kurzy, nicméně znalost základů statistického uvažování je vhodná.

Navazující kurzy

Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:

Data mining v praxi v prostředí Workspace.

Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro neuronové sítě, pak doporučujeme kurzy:

Klasifikační a regresní stromy,

Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
  • 10 / 04 / 2018
  • Data Mining
  • Pro profesionály

Text Mining

1
Zelený Pruh 95/97, Praha 4
7900,- Kč bez DPH

Tento jednodenní kurz je určen těm, kteří se zajímají o možnosti získávání a vyhodnocování informací z textových dokumentů, nejčastěji z webových zdrojů, ale i ze souboru textových dokumentů nebo různých databází. Cílem kurzu je ukázat možnosti jak pracovat s vágními textovými informacemi a jak z nich získat užitečnou informaci pro další zpracování a rozhodování. Využití text miningu lze spatřovat například v oblasti sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cílová skupina

  • Analytici, datoví specialisté či statistici, kteří chtějí využít informace v datech ve formě nestrukturovaného textu.
  • Text mining se využívá v oblastech sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.

Cíle kurzu

  • Ukázat, jak a čím může být metodologie text miningu přínosná.
  • Pochopit, jak může v úlohách text miningu přispět software TIBCO Statistica.
  • Ukázat si, jaké všechny možnosti a nastavení lze použít.
  • Vysvětlit si pojmy, které se běžně v souvislosti s text miningem vyskytují
  • Naučit se, jak využít získanou informaci ve formě indexového souboru pro další analýzy.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy
  • Seznámení s prostředím TIBCO Statistica
  • Načtení dat, různé typy výstupů, získání dat z databáze
  • Možnosti grafických výstupů

Účel, princip a zdroje text miningu

Nastavení podmínek pro prohledávání a nastavení filtrů

  • Výběr jazyka, zastoupení slov,…
  • Nastavení frází, povolených, zakázaných slov, synonym
  • Nastavení délky slov, max. počet souhlásek, povolených znaků, atd.

Vytvoření a práce s indexovým souborem a frekvenční maticí

Výběr významných příznaků (prediktorů) pro klasifikační úlohu

Klasifikace

  • Klasifikační stromy
  • Metody strojového učení
  • Neuronové sítě

Shluková analýza nad získanými daty

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows.

Navazující kurzy

Logickým navázáním na kurz je detailní vysvětlení metodologie, jak používat výsledky z textminingové analýzy.

Vhodnými tedy mohou být kurzy:

  • Data Mining (dvoudenní nebo třídenní varianta)
  • Neuronové sítě
  • Klasifikační a regresní stromy

Certifikace

Účastník získá certifikát o úspěšném absolvování kurzu.

 

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu (nezávazně)

po odeslání přihlášky vás budeme do 24 hodin kontaktovat
Zavřít
Pořiďte si licence nebo si zvolte vyhovující formu podpory

Licence
a podpora

Popis typů licencí

Jednotlivé produkty (analytické balíčky Professional, Expert - Quality Control, Expert - Data Science, Enterprise) lze kombinovat s určitým typem licence. Licence se od sebe odlišují typem instalace, počtem přistupujících uživatelů a specifickými funkcemi (možnosti reportování, přístup přes web apod.). Cílem následujícího textu je představit si jednotlivé typy licencí, které lze pořídit.

Jednouživatelská (desktopová) licence – Named User license

Umožňuje instalovat software na konkrétní počítač a na něm ho následně provozovat. Licence je vázaná na uživatele, nikoliv na pracovní stanici. V případě potřeby změny počítače (poruchy, novější PC) se provede „odregistrace“ licence a následně je možné software nainstalovat na jiný PC.

Pro koho je určena:

Tato licence se využívá celosvětově na výzkumních pracovištích, v laboratořích, malých firmách, apod. Je využitelná všude tam, kde je koncový uživatel pouze jeden. Velmi oblíbená je na akademické půdě pro jednotlivé studenty / pedagogy / výzkumní pracovníky.

Dostupná pro produkty:

  • Professional
  • Expert – Quality Control
  • Expert - Data Science
  • Enterprise
  • Speciální akademické produkty

Dostupné časové provedení:

  • Trvalá licencie (Perpetual) – bez časového omezení s možností dobrovolné technické podpory
  • Časová licence (Subscription) – roční licence zahrnující technickou podporu po dobu platnosti licence

Výhody:

  • Velmi jednoduchá instalace
  • Nižší pořizovací náklady

Plovoucí síťová licence – Concurrent User

Smyslem síťové licence je flexibilní využití softwaru Statistica pro široké spektrum pracovních stanic v rámci instituce. Software lze nainstalovat na libovolný počet pracovních stanic, které jsou spojeny lokální sítí. Rozhoduje počet současně přistupujících uživatelů, který je dám počtem zakoupených licencí (licence „plavou“ mezi pracovními stanicemi dle aktuálního využití software uživateli). Prakticky je tedy počet uživatelů, kteří při této licenci mají možnost se softwarem pracovat, neomezený.

Pro koho je určena

Tato licence je využívaná v společnostech z nejrůznějších oblastí lidské činnosti, kde existuje vícero uživatelů – bankonvictví, průmysl, výzkum, marketing, utility, atd. Také je ve velké míře využívaná ve výzkumních institucích napříč výzkumnými týmy a odděleními, na univerzitách v rámci kateder, nebo celých fakult. Velmi oblíbené je využití v učebnách univerzít, kde tento typ licence umožňuje komfortní a pohodlnou administraci.
Při tomto typu licence lze kombinovat jednotlivé produkty softwaru a zakoupit tak konfiguraci přesně podle toho, jak bude program využíván. Lze tedy optimalizovat náklady na licence podle potřeb a počtu uživatelů.

Dostupná pro produkty:

  • Expert – Quality Control
  • Expert - Data Science
  • Enterprise
  • Speciální akademické produkty

Dostupné časové provedení:

  • Trvalá licencie (Perpetual) – bez časového omezení s možností dobrovolné technické podpory
  • Časová licence (Subscription) – roční licence zahrnující technickou podporu po dobu platnosti licence

Výhody:

  • Velmi jednoduchá instalace
  • Komfortní a pohodlná administrace
  • Využití neomezeným počtem uživatelů v rámci LAN
  • Vhodná pro optimalizaci nákladů

 

Technické detaily licence 

Tento typ licence sestává z instalace síťového Statistica serveru, což může být i obyčejný průměrný počítač. Tento licenční Statistica server v sobě obsahuje ověřování licencí licenčním manažerem (FLEXlm ) a také soubory nutné pro spuštění softwaru. Plovoucí licence umožňuje následující způsob spouštění aplikace Statistica:

  1. Ze Statistica serveru je z uvedeného sdíleného adresáře nainstalován libovolný počet klientských stanic. Maximální počet současně přistupujících uživatelů je nastaven v počtu zakoupených licencí (viz varianty řešení). Na klientský počítač se defaultně nainstaluje kompletní instalace softwaru, tento typ instalace je nazýván jako BNET a umožnuje dočasné odpojení klientského počítače od licenčního serveru. Licenci je možné vypůjčit až na 30 dní. Uživatel tedy může mít funkční software Statistica např. na notebooku během pracovní cesty.
  2. Síťová plovoucí instalace volitelně umožňuje také variantu, kdy se ze serveru nainstaluje pouze minimum souborů nezbytných pro spojení se Statistica serverem (varianta CNET), ze kterého jsou po úspěšném ověření a přiřazení volné licence stažené všechny knihovny a spustitelné soubory programu (při samotném spuštění cca. 50 MB, celkem až 291MB)). Na klientský počítač jsou tedy knihovny Statistica staženy až pouze v případě, kdy je nutné je využít. Tato instalace umožňuje velmi snadnou správu, neboť všechny upgrady jsou instalovány pouze na „centrální“ počítač – server.

 

V obou síťových verzích probíhají výpočty na klientských stanicích. Klientskou stanicí však může být i výkonný server ve společnosti. Způsob práce ilustruje následující schéma. Schéma ilustruje i možnost odpojení počítače od vnitřní sítě a využívání řešení mimo síť (na služební cestě, prezentací na konferenci atd.).

 

Zavřít
Petra má ráda cestování a dobré jídlo. Kromě toho je fanda kontingenčních tabulek.

Instalace
a implementace

Zavřít
Petra má ráda cestování a dobré jídlo. Kromě toho je fanda kontingenčních tabulek.

Školení
a podpora uživatelů

Zavřít
Petra má ráda cestování a dobré jídlo. Kromě toho je fanda kontingenčních tabulek.

Konzultace
a odborná

Zavřít
Snadná a intuitivní tranformace dat

Alpine Data

Zavřít
Flexibilní BI k zabudování do aplikací

TIBCO JasperSoft

Zavřít
Intuitivní BI nástroj s pokročilou analytikou

TIBCO Spotfire

Zavřít
Komplexní analytický nástroj pro správu a zpracovávání dat ve všech oblastech lidské činnosti

TIBCO Statistica™

  • O Statistice
  • Produkty
  • Funkce
  • Ke stažení

TIBCO Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších.  Analytická platforma Statistica umožní organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do provozu.

Produkty (balíčky) TIBCO Statistica

Produkty jsou balíčky funkcionalit a rozšíření základního nástroje. Většinu analytických metod najdete ve verzi Professional. Specifické rozšíření jsou potom spojena s balíčky určenými na konkrétní aplikaci. Čtěte dále pod záložkou produkty.

Každý balíček může být dodán v různých licenčních formách. Více na téma licence.

Funkce

Professional

Expert

Quality Control

Expert

Data Science

Enterprise 

Základní statistiky a vizualizace
Pokročilá statistika
Průmyslová statistika

Reportovací tabulky

Vizualizační panely
Vícerozměrné statistiky
Porovnávací metody

*

* *

*

Analýza přežití

*

* *

*

ETL
Modul tvorby pravidel
PI konektor
Variace
Testování hypotéz
Data Mining
Vývojové nástroje
Optimalizace procesů
Text Mining
In-Database Analytics

**

* Tyto moduly můžou být dodatečně licencovány „al carte“
** In-Database Analytics jsou doplňkem Statistica Serveru.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Produkty

Professional
Je základní verzí programu Statistica. Nabízí celé spektrum klasických statistických metod včetně reportingu a vizualizace. Pomocí intuitivního rozhraní založeného na standartních windows ikonách mohou být analýzy jasně strukturovány, snadno automatizovány a znovu použity. Díky přívětivému uživatelskému rozhraní je produkt vhodný pro příležitostné analytiky dat. Statistica Professional je vhodným nástrojem pro každého uživatele, který chce provádět základní nebo pokročilé analýzy a vizualizace na své lokální stanici.

Expert – Quality Control (DOPORUČUJEME)
Tento produkt obsahuje všechny funkce verze Statistica Professional. Navíc jsou v nabídce speciální možnosti ETL(extract, transform a load) a specifické přístupy k datům. Díky funkci Tvorba pravidel mohou být analýzy dat automatizovány na přehledném dashboardu, kde můžete sledovat i upravovat definovaná pravidla v reálném čase. Tento produkt je vhodný pro analýzu dat ve výrobních podnicích a v technických procesech. Je vhodným základním kamenem pro naplnění iniciativy v rámci zavedení prvků INDUSTRY 4.0 (více k tématu zde) a to v jakémkoli odvětví, kde chcete získat informace prostřednictvím vizualizací a analýz založených na heterogenních datových zdrojích a požadavcích založených na pravidlech. K dispozici jako stolní, síťová a serverová verze, díky které může být Statistica Expert – Data Science rozšířena na celopodnikový analytický systém.

Expert - Data Science
Pokud jde o pokročilou analytiku, což znamená zejména výpočet prediktivních modelů pro různá strategická rozhodnutí založená na datových údajích nebo průzkumu velkých dat, je jasnou volbou Statistica Expert - Data Science. Nabízí kromě klasických metod statistické analýzy všechny důležité metody předběžné analýzy od přípravy dat, modelování až po definované nebo parametrizovatelné predikční modely. Zkušený vědecký pracovník využívá intuitivní rozhraní Statistica k vytváření a implementaci komplexních procesů analýzy. Statistica Expert - Data Science je dostupná v desktopových, síťových a serverových verzích a může být nasazena jako celopodnikový analytický systém.

Statistica Enterprise
Funkce verze Statistica Enterprise přesahují rámec Statistica Expert – Quality Control a Statistica Expert - Data Science. Jsou nabízeny metody pro optimalizaci procesů a licence umožňuje importovaní či exportování modelů do jiných formátů, aby mohly být začleněny do aplikací třetích stran a použity nezávisle na Statistice. Verze Statistica Enterprise je k dispozici na koncových stanicích, v síťové licenci a v serverových verzích a může být nasazen jako celopodnikový analytický systém. Serverová verze umožňuje kompletní automatizaci procesů a správu všech analytických procesů v podniku, včetně přístupu k datům, analýzám, přehledům a distribucím informací.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Funkce

FUNKCE Základní statistiky a vizualizace

Data, data, data - žádná společnost bez nich nemůže fungovat. Pro jejich využití v rozhodovacích procesech je zapotřebí vhodných nástrojů pro analýzu. To platí nejen pro projekty s "big daty", ale také pro jakékoli další data z databázových či transakčních systémů nebo dokonce z excelů nebo z papíru. Pro splnění těchto požadavků nabízí Statistica komplexní softwarový balík základních statistických operací a vhodných grafických výstupů. To vše doplněno intuitivním ovládáním, všestranností a příjemným pracovním prostředím podobným právě nástroji MS Excel.

Nativní schopnosti nástroje STATISTICA

  • Velmi přesné výpočty
  • Různé zobrazovací formáty pro data podle interpretace obsahu
  • Automatické značení významných výsledků
  • Zpracování výstupů formou závěrečné zprávy
    • Jednoduché formátování výstupu
    • Možnost vložit grafy a tabulky do sestav
    • Podpora formátů HTML, Word, RTF a PDF
  • Nástroje pro přípravu dat
    • Detekce chybějících dat a dat mimo stanovený rozsah
    • Detekce odlehlých a extrémních hodnot
    • Překodování a tvorba nových proměnných
    • Úprava řádků a sloupců tabulky
    • Zpracování chybějících dat/duplicitních případů
    • Funkce (matematické, statistické, operátory a mnoho dalších) pro tvorbu nových proměnných a získání dalších informací z proměnných stávajících
    • Přeskupování a seskupování proměnných
    • Standandardizace a normalizace proměnných
    • Slučování tabulek
    • Filtrování
    • Transpozice, třídění dat
    • Kombinace různých zdrojových datových tabulek, práce s různými typy proměnných
    • Výběr dílčích oblastí, výběr případů
    • Generování náhodných čísel
    • Výkonná a rychlá transformace dat (načtení, modifikace, uložení)
  • Snadné použití výsledků tabulek jako vstup pro další analýzu
  • Analýzy a hodnocení platné pro celé tabulky nebo označené bloky

Popisná statistika, strukturovaná statistika, průzkumná analýza dat

  • Popisné statistiky
    • Střední, modální hodnota
    • Kvartil, uživatelsky definované percentily
    • Průměrná, směrodatná odchylka, rozptyl
    • Šikmost a špičatost (s příslušnými standardními odchylkami)
    • Intervaly spolehlivosti pro střední hodnotu
    • Intervaly spolehlivosti pro průměr
    • Harmonický průměr, geometrický průměr
    • Speciální popisné statistiky a diagnostické charakteristiky
    • Minimum, Maximum, Součty
    • Rozpětí, vzdálenost kvartilů
  • Čištění dat
    • Oříznutí dat (trimmed agent)
    • Zprostředkování dat (winsorized agent)
    • Grubbsův test pro odlehlé hodnoty
  • Ověření normality dat podle:
    • Kolmogorov-Smirnova testu
    • Lillieforsovy zkoušky
    • Shapiro-Wilkova testu normality
  • Analýzy podle skupin
    • Seskupení dat podle kategorických proměnných
    • Kategorizace spojitých proměnných
    • Překódování proměnných
    • Hierarchická struktura a analýza jednotlivých podskupin
  • Průzkumná analýza dat v různých grafických výstupech
    • Box-plot diagramy
    • Histogramy, dvourozměrné histogramy (3D nebo v kategoriích)
    • 2D a 3D bodové grafy
    • Distribuční grafy (jednostranné, upravené dle trendu)
    • Q-Q grafy, P-P grafy

…další metody zobrazení dat

Korelace

  • Míry asociace
    • Pearsonův korelační koeficient
    • Spearmanův korelační koeficient
    • Kendallovo Tau (b, c)
    • Gama
    • Tetrachorický koeficient korelace
    • Cramerovo V
    • Koeficient podmíněnosti C
    • Sommerovo d
    • Koeficient nejistoty (uncertainty coefficient)
    • Parciální korelace
    • Autokorelace
  • Výpočet korelačních matic
    • Vyloučení chybějících hodnot (v párech nebo případ po případu)
  • Grafické znázornění výsledků
    • Bodový graf s intervaly spolehlivosti
    • Maticové bodové grafy
    • Plošné grafy
    • Dvourozměrné 3D histogramy
    • Pravděpodobnostní grafy
    • …další metody zobrazení dat
  • Diagnostika a čištění odlehlých hodnot

Interaktivní výpočet pravděpodobnosti

  • rozsáhlý výběr distribucí
  • beta
  • binomický
  • Cauchy
  • Chi-kvadrant
  • exponenciální
  • extrémní hodnota
  • F
  • gama
  • hypergeometrické
  • Laplace
  • lognormální
  • logistické
  • Pareto
  • Poissono
  • Rayleightovo
  • T (Student)
  • Weibullovo
  • Z (Normální)
  • Výpočet parametrů pro korelaci Pearson-Produkt-Moment
  • Six Sigma výpočty
  • Výpočet DPMO

t-testy (testy rozdílu mezi skupinami)

  • nezávislé vzorky podle skupin
  • nezávislé vzorky podle proměnných
  • (spárované) vzorky
  • jediný vzorek
  • Hotelové hosté T²
  • Různé možnosti v dialogovém okně výsledků:
  • oddělený odhad odchylky
  • interval spolehlivosti
  • Leveneův test pro homogenitu rozptylu
  • Test Brown & Forsythe
  • Typické grafické výstupy analýzy
  • Box ploty
  • Histogramy v kategoriích
  • Normální distribuční plochy (v kategoriích, jednostranné, upravené trendy)
  • Scatter-plot v kategoriích
    …další metody zobrazení dat

Tabulky rozptylů, kontingenční tabulky, tabulky se shluky, analýza více odpovědí

  • Určete okrajové frekvence a poměry kategorických nebo dichotomických proměnných
  • Možnosti pro zpracování chybějících hodnot (chybějící údaje)
  • Párové zpracování proměnných
  • Kategorizace případů s vlastními podmínkami výběru
  • je možné individuální formátování výsledkových tabulek
  • Styl rozpadu nebo hierarchické uspořádání faktorů
  • Řádky, sloupce nebo celkové procenta v kontingenčních tabulkách (křížové tabulky)
  • Zvýraznění určitých kategorií
  • kumulativní, relativní, logit- a probit-transformované frekvence
  • Očekávaná hodnota při normálním rozdělení
  • Kolmogorov-Smirnov test
  • Lillieforsova zkouška
  • Shapiro-Wilkův testu
  • Reziduální rozptyl
  • Statistické testy pro kontingenční tabulky (křížové tabulky)
  • Pearson r
  • Maximální pravděpodobnost
  • Yatesův korigovaný Chi-kvadrant
  • McNemarův Chi-kvadrant
  • Fisherův přesný test (jednostranný a oboustranný)
  • Cramérsovo V a C
  • Tetrachorické r
  • Kendallův Tau (b, c)
  • gama
  • Spearmanův R
  • Sommersovo D
  • koeficient nejistoty
  • Typické grafické výstupy analýzy
  • Interaktivní plot diagramy pro různé frekvence
  • 3D histogramy, histogramy v kategoriích
  • Normální distribuční plochy (v kategoriích, jednostranné, upravené trendy)
  • Box-plot diagramy

Vícenásobné regrese

  • modely lineární regrese
  • jednoduché, vícenásobné (i pro seskupená data)
  • postupně (vpřed, vzad, v blocích)
  • Modely s nebo bez konstant
  • Modely regrese „Ridge“
  • vážené nejmenší čtverce
  • Vlastnosti regresních tabulek
  • Standardní chyba pro B, beta a konstantu
  • R², opravený R²
  • ANOVA tabulka
  • Matrice s (částečnými) korelačními koeficienty
  • Korelace a kovariance regresních koeficientů
  • Sweep matice (inverzní matice)
  • Durbin-Watsonova statistika
  • Mahalnobiho a Cookova vzdálenost
  • Rezidua pro odstranění pozorování
  • Intervaly spolehlivosti pro prognózované hodnoty
  • dvoustupňová regrese nejmenších čtverců (makro)
  • Transformace Box-Tidwell (makro)
  • Typické grafické výstupy analýzy
  • Rozdělení zbytku, vykreslení odlehlé hodnoty
  • Standartní diagramy pravděpodobnost
  • pozorované hodnoty, prognózované hodnoty
  • Grafy částečné korelace
  • Iconplots

Neparametrické statistiky

  • Wolf Forestův test
  • Mann-Whitneyův U-test (s přesnými pravděpodobnostmi namísto Z-aproximace u malých vzorků)
  • Kolmogorov-Smirnovův test
  • Wilcoxonův test pro související vzorky
  • Kruskal-Wallisova hodnocení a analýza odchylek
  • Median test
  • Friedmanova hodnostní analýza rozptylu
  • Cochranův Q-test
  • McNemarův zkouška
  • Kendallův koordinační koeficient
  • Kendallův Tau (b, c)
  • Spearmanův R
  • Fisherův přesný test
  • Chi-kvadrát
  • V-square statistika
  • gama
  • Sommersovo d
  • nahodilost
  • Typické grafické výstupy analýzy
  • 3D histogramy, histogramy v kategoriích
  • Matrix-scatter-plots diagramy
  • Box-plot diagramy

Rozdělení pravděpodobnosti

  • normální rozdělení
  • rovnoměrné rozdělení
  • exponenciální
  • gama distribucedistribuce logaritmická normální
  • Chi-kvadrant čtverce
  • Weibullovo
  • binomické
  • Poissonovo
  • Geometrické rozložení
  • Alternativní rozdělení
  • Chi-kvadrát test
  • Kolmogorov-Smirnovův test jednoho vzorku
  • Lillieforsovo zkouška
  • Shapiro-Wilkův testu
  • Funkce hustoty a distribuce
  • simulační metody
  • Monte Carlo
  • Latinské vzorkování Hypercube (LHS)
  • Způsoby Iman-Conovera
  • LHS s Iman Conoverovou metodou
  • Typické grafické výstupy analýzy
  • Plot P-P, plot Q-Q
  • Box plot
  • Histogramy (s úpravou, kumulativní)
  • Empirická distribuční funkce

FUNKCE Pokročilá statistika

Obecné lineární modely (OLM)

  • Předdefinované standardní modely
  • jednorozměrná, multivariační analýzy rozptylu (ANOVA / MANOVA)
  • ANOVA s hlavními a interaktivními efekty
  • pevné a / nebo náhodné faktory (smíšený model ANOVA)
  • Hierarchická ANOVA
  • ANOVA s opakovaným měřením (korekce podle Greenhouse-Geisser, Huynh-Feldt)
  • Vícenásobné regrese s hlavními a interakčními účinky
  • Polynomická regrese
  • Účinnost regresní oblasti
  • Regrese oddělených modelů
  • Kovarianční analýza s hlavními účinky
  • Model oddělených regresí
  • Kovarianční analýza s hlavními a interakčními účinky
  • Uživatelské modely
  • ANOVA / MANOVA
  • Další regresní metody
  • Další kovariační analýzy
  • integrovaný asistent pro vhodnou volbu modelu
  • Editor syntaxe analýzy (volitelně také syntaxe SAS)
  • Doplňkové zkoušky a modelové zkoušky
  • LACK-OF-FIT test
  • Post-hoc testy, analýza kontrastu, srovnání s kontrolní skupinou (Dunnettův test)
  • Multivariační testy (Wilks, Pillai's, Hotelling's, Roy's)
  • Testy na vlastní hypotézy / chybové termíny
  • Test homogenity rozptylu (Bartlettův Chi², Levenův test)
  • podrobné zbytkové statistiky
  • Graf hlavních a interakčních efektů
  • Rozptylové grafy pro zbytky, předpovědi hodnot
  • Histogramy a normální rozdělení
  • Box-plot diagramy
  • aplikace modelu
  • Integrovaný výpočet optimalizace s profilem nárazu
  • Výpočet odhadovaných hodnot pro nové případy
  • Výsledek předpovědi s exportem do textu

Obecné regresní modely (ORM)

  • Předdefinované standardní modely
  • jednorozměrné, multivariační analýzy rozptylu (ANOVA / MANOVA)
  • ANOVA s hlavními a interaktivními efekty
  • Více regrese s hlavními a interakčními účinky
  • Polynomická regrese
  • Účinnost regrese oblasti
  • Regrese povrchu směsi
  • Kovariační analýza s hlavními účinky
  • Kovariační analýza s hlavními a interakčními účinky
  • Uživatelské modely
  • různé ANOVA / MANOVA
  • různé regresní metody
  • různé kovarianční analýzy
  • Automatická konstrukce modelu
  • Stepwise forward / backward výběr prediktorů
  • Nejlepší podskupiny Výběr prediktorů
  • Volitelné nahrávání s předpovědní funkcí
  • integrovaný asistent pro vhodnou volbu modelu
  • Editor syntaxe analýzy (volitelně také syntaxe SAS)
  • Doplňkové zkoušky a modelové zkoušky
  • LACK-OF-FIT Test
  • Post-hoc testy, analýza kontrastu, srovnání s kontrolní skupinou (Dunnettův test)
  • Multivariační testy (Wilks, Pillai's, Hotelling's, Roy's)
  • Testy na vlastní hypotézy / chybové termíny
  • Test homogenity rozptylu (Bartlettův Chi², Levenův test)
  • podrobné zbytkové statistiky
  • Graf hlavních a interakčních efektů
  • Rozptylové grafy pro zbytky, předpovědi hodnot
  • Histogramy a normální rozdělení
  • Box-plot diagramy
  • aplikace modelu
  • Integrovaný výpočet optimalizace s profilem nárazu
  • Výpočet odhadovaných hodnot pro nové případy
  • Výsledek bádaní možno exportovat jako text

FUNKCE Průmyslová statistika

Statistica kombinuje standardní statistické techniky a efektivní grafiku a snadnou obsluhu. Různé "grafy kontroly kvality" umožňují jasně ilustrovat vývoj důležitých vlastností procesu měření kvality. "Analýza procesů" nabízí rozsáhlé metody pro kontrolu statistických procesů a analýzu měřicích systémů. A modul "Experiment Planning" vás pomůže při tvorbě a analýze experimentálních návrhů. Navíc "Analýza výkonu" vám umožňuje zjistit, jaké velikosti vzorku potřebujete, abyste získali smysluplné výsledky před reálným provedením.

  • Grafy kontroly kvality (QC grafy)
    • Řídicí diagramy testu měření
    • X-transverse & R (mapa osy X pro průměry, mapa R pro disperzi procesu)
    • X-Quer & S (mapa osy X pro průměry, S-mapa pro rozptyl procesu)
    • X & MR (X-karta pro jednotlivé hodnoty, karta pohyblivého rozsahu pro rozptyl procesu)
    • MA X-Transverse & R-Map (klouzavý průměr: klouzavý průměr)
    • Karta MA X-Cross & S
    • EWMA X-Quer & R-Map (exponenciálně vážený klouzavý průměr)
    • Karta EWMA X-Quer & S
    • Jednotlivé hodnoty karty CUSUM (kumulativní souhrnná kontrolní karta)
  •  Kontrolní tabulky pro zkoušku hodnocení
    • C-karta (počet defektů, distribuce Poissonu)
    • U-karta (míra deficitu, distribuce Poissonu)
    • Karta Np (počet odmítnutí, binomická distribuce)
    • P-karta (míra odmítnutí, binomická distribuce)
  • Pareto
  • Multivariační grafy řízení kvality
    • Hotelling T² karta pro jednotlivé nebo průměrné hodnoty
    • Jednoduché nebo průměrné skóre MEWMA (multivariační exponenciálně vážený pohyblivý průměr)
    • Multivariační CUSUM karta
    • Karty Multiple Stream X / MR (víceúčelová jednosměrná karta s vícenásobným proudem a vícenásobná přenosová rychlost)
    • Karty Multi-Stream X-Quer & R (víceúrovňová mapa pro ukázkové prostředky a mapu rozmezí více proudů)
    • Karta Multi-Stream X-Quer & S (karta s více streamy pro vzorkovací prostředky a karta standardní odchylky pro více streamů)

Analýza procesů a měřících systémů (SPC, MSA)

  • Analýza způsobilosti procesu a výkonnosti procesu
  • Analýza způsobilosti procesu a toleranční intervaly, jednotlivé údaje nebo souhrnné údaje
  • Procesní způsobilost DIN ISO 21747 (modely distribučního času)
  • Schopnost procesu pro toleranci polohy (dvourozměrná procesní schopnost)
  • Analýza schopnosti testu počítání (binomická a Poissonova distribuce)
  • Analýza měřicího systému (MSA)
  • Schopnost měřicího zařízení s a bez vlivu obsluhy (MSA I / III)
  • Opakovatelnost a srovnávací přesnost měření (MSA II, opakovatelnost a reprodukovatelnost měřidla, R & R)
  • Linearita měřicích přístrojů (lineární linearita)
  • Analýza přiřazovacího měřicího systému (analytická metoda)
  • Přizpůsobivá analýza kontroly
  • MSA přiřazovací data s referencí a bez odkazu (účinnost měřicího systému)
  • Analýza prostojů
  • Odhadovaná životnost s distribucí Weibull
  • Cenzurované a necenzurované prostoje
  • Určení doby bez poruchy (parametr polohy)
  • Weibullovy sítě
  • Diagramy příčin a účinků (Ishikawa, Fishbone)

Reportovací tabulky

  • Reportovací tabulky

Vizualizační panely

Vytvořte smysluplné panely, které vám umožní vizualizovat a shromažďovat data. Funkce drill-down ve vizualizačních panelech umožňuje vyhledávat kontexty na různých úrovních agregace a interpolovat chybějící data.

FUNKCE Vícerozměrné statistiky

Porovnávací metody

Nejen v klinických studiích ale i v jiných oblastech, jako je například průmyslová výroba, nebo služby vyžadují způsoby, jak ověřit nebo porovnat jednotlivé výsledky a následně vyhodnotit jak zafungovala například úsporná opatření. V praxi se často používají nevhodné statistické metody, jako jsou jednoduché korelační analýzy nebo průměrná srovnání.
Porovnávací metody v nástroji Statistica kombinuje současné výpočty a vizualizační standardy porovnání metod měření. Zahrnuty jsou:

  • Regrese na Passing-Bablog
  • Deming regrese (jednoduchá, vážená, IRGDR)
  • Bland-Altmanovy diagramy
  • Zvláštní hodnocení, jako jsou chybové mřížky a výpočty předsudků.
  • Z porovnání můžete stisknutím tlačítka vygenerovat sofistikovanou statistiku s grafickými a číselnými výstupy!

FUNKCE Analýza přežití

Společnosti ve farmaceutickém průmyslu používají při dlouhodobém vyhodnocení statistické metody pro výpočet doby trvanlivosti výrobku nebo či opakovaného zkoušení účinné složky podle přísných specifikací evropských regulačních orgánů. Pravidlo Q1E Mezinárodní konference o harmonizaci (ICH) obsahuje konkrétní nařízení pro statistické zpracování údajů o stabilitě, jejichž realizace vyžaduje hlubokou znalost regresní a kovarianční analýzy.

STATISTICA Add-on Analýza přežití umožňuje automatizovat výpočet trvanlivosti (skladovatelnost) a výkon účinné složky (přezkoušení období) po Q1E preferencí:

Stanovení pojmu pro jednotlivé nebo vícenásobné dávky
Analýza Covariance pro sdružování údajů
Automatické určování modelu statistickým testem na stejném vzorku a stejným zachycením funkce stability více dávek
Přepínání mezi německým a anglickým jazykem pro vstupní masky a výstupní výsledek
Automatické generování sestavy ve formátu pdf
Pomocí modulu analýza přežití můžete vyhodnocovat studie stability a na stisknutí tlačítka vytvářet archivovatelné výstupní dokumenty!

FUNKCE ETL

Nástroj Statistica Extract, Transform a Load ( ETL) extrahuje, transformuje a načítá data z různých zdrojů do tabulky statistik. Heterogenní zdroje dat jsou standardizovány, koordinovány a přímo přístupné další analýze.
Například data z jedné minuty z jedné databáze mohou být přiřazena k hodinovým datům jiné databáze takovým způsobem, že příslušné hodnoty měření nebo charakteristiky z obou zdrojů dat mohou být následně analyzovány dohromady. V tomto případě mohou být údaje v minutách statisticky shromažďovány různými způsoby - například sumarizací nebo zprůměrování. Další pokyny pro zpracování, jako je rozsah hodnot nebo časové filtry, které je třeba vzít v úvahu, lze pohodlně definovat pomocí uživatelsky přívětivého menu. To umožňuje flexibilní zpracování procesních dat v rámci platformy Statistica.
Nástroj ETL je speciálně optimalizován pro požadavky na vyhodnocení dat pomocí osvědčeného podnikového řešení Enterprise Server . Data, která se mají extrahovat, mohou pocházet ze standardních databází, jako jsou například databáze Oracle nebo SQL Server, soubory Statistica nebo speciální procesní databázový systém PI. Různé zdroje dat lze extrahovat, upravovat a přenášet do analytických tabulek v jednom kroku. Tento nastavený proces ETL může být zaznamenán a integrován do Enterprise Serveru , aby mohl být vyvolán a automatizován nebo později změněn.
To umožňuje analytikovi interaktivně kompilovat data z externích zdrojů v rozhraní Statistica způsobem, který je optimální pro analýzu dat. Následující analýzy dat mohou být prováděny interaktivně nebo automaticky, takže lze vytvořit automatizovaný proces od extrakce dat až po zprávu o analýze.

FUNKCE Modul tvorby pravidel

Neomezená tvorba parametrizovatelných pravidel a workflow

FUNKCE PI konektor

FUNKCE Variace

FUNKCE Testování hypotéz

Testování hypotéz (WoE) usnadňuje pochopení a modelování vztahů, kde existují binární cíle. Tak je tomu v mnoha průmyslových odvětvích, bez ohledu na to, zda jde o různé cílové kategorie jako "dobré" vs. "špatný", "zdraví" vs. "Nemoc" nebo "ano" "Ne".

S testováním hypotéz jsou proměnné rekodifikovány takovým způsobem, že separační síla k závislé proměnné je maximalizována. Metrické proměnné se převádějí do tříd a kategorické proměnné se rekodují.

V praxi si lze představit, jak se úvěrová splatnost snižuje s tím, jak se doba splácení zvyšuje. Každému (různě širokým) měsíčnímu intervalu je přiřazena hodnota WoE, což znamená, že negativní hodnoty WoE znamenají nepřiměřeně mnoho úvěrových ztrát.

Hledání nejefektivnějšího řešení probíhá automaticky pomocí metody rozhodovacího stromu, a to i pro více ovlivňujících se proměnných, a může také zvládnout odlehlé a chybějící data.

Uživatelé mohou určit, zda by měly být zobrazeny složité nelineární vztahy a interakce mezi ovlivňujícími proměnnými nebo by měly být zobrazeny pouze jednoduché trendy. Pro snadnější porozumění lze použít i méně granulární klasifikaci.

Kódování WoE je vydáno ve formě pravidel, které snadno aplikujete na data pouhým kliknutím.

S testováním hypotéz můžete často získat lepší výsledky při modelování, zejména při logické regresi. Vzhledem k tomu, že metrické hodnoty WoE jsou přiřazeny k třídám nebo kódům s přímým odkazem na cílové data, není zapotřebí fiktivního či efektivního kódování (což také často zahrnuje problémy s odhadem) a usnadňuje interpretaci modelů.

FUNKCE Data Mining

Funkce Data Mining (dolování dat) nástroje Statistica obsluhuje celý proces dolování dat - od vytvoření databázového dotazu až po vytvoření metody konečné sestavy – modul je výkonný a snadno použitelný.

Funkce Data Mining nástroje Statistica se přizpůsobují vašim potřebám a znalostem. Vyberte si mezi různými aplikačními režimy, které se liší možností obsluhy a stupněm automatizace:

  • V expertním režimu používáte celou řadu metod a možností.
  • Vizualizace projektu automatizuje celý proces dolování dat, od získávání dat až po výstupní výsledky.
  • Asistent vás provede nejdůležitějšími kroky analýzy s jasným návodem k použití.

Data Mining často přesouvá velmi velké objemy dat a provádí komplexní výpočty modelů - proto je nezbytným předpokladem dobrá výkonnost softwaru.

S datovými funkcemi společnosti Statistica jste dobře připraveni:

Optimalizované algoritmy vyvinuté pomocí nejmodernější technologie kompilátorů, 64bitové verze pro podporu rychlejších procesorů a k distribuci procesů na více procesorech.
Optimalizovaný přístup k čtení a zápisu do velkých databází:
Procesní technologie čte data asynchronně přímo z databázových serverů.

Serverová verze také umožňuje přenos všech výpočtů na vysoce výkonné víceprocesorové počítače a také z počítače v intranetu nebo Internetu prostřednictvím webového rozhraní - tedy bez instalovaných komponent Statistica - jsou řízeny.

Nejlepší metoda pro dolování dat neexistuje. Dobrý nástroj pro dolování dat musí proto nabízet širokou škálu metod. Funkce Data Mining softwaru Statistica jsou ideální pro tyto použití:

  • Četné metody přípravy dat, jako je filtrování, výběr a transformace
  • Výběr funkcí pro identifikaci relevantních prediktorů
  • Klasifikační a regresní stromy (CART, CHAID), interaktivní rozhodovací stromy, posílené stromy a náhodné lesy
  • Generalizované doplňkové modely, MAR Splines
  • EM a k-menas-clustering, nezávislá analýza komponent, jednoduchá a sekvenční pravidla přidružení
  • Postupy neuronové sítě včetně samoorganizačních map (SOM)
  • K-nearest sousedé, podpůrné vektorové stroje (SVM), Bayesovský postup
  • Techniky jako Hlasování, Bagging, Boosting, Meta-Learning
  • všechny jednoduché a vyšší statistické metody (jako je regrese, diskriminace a analýzy časových řad)
  • vynikající interaktivní vizualizační nástroje a mnohem více

Scénáře
Požadavky na dolování dat jsou různorodé ve všech odvětvích: Banky, pojišťovny, Mass-media, maloobchod, zásilkový obchod, e-commerce nebo telekomunikační společnosti je již úspěšně používají. Ale i průmyslová výroba, logistika, biochemie, výzkum, medicína a farmaceutický výzkum se stále setkává s potřebou dolování dat k optimalizaci procesů a zkoumání příčiny.

Tradiční data mining aplikace
zákaznická segmentace nabízí segmentaci zákazníků do skupin s podobnými sociodemografickými profily a poptávkovými modely pro cílený přístup.

Vyhodnocení rizik
Předpovědi na základě již získaných dat, aby se minimalizovalo riziko selhání. Vytvořte modely a scénáře pro hodnocení rizik. Vyhodnoťte úvěrové riziko podle Basel II.

Optimalizace marketingu
Zvyšte odezvu a návratnost investic vašich přímých marketingových kampaní: individuálním kontaktem s klientem, frekvencí zasílání a nabídkou na míru. Optimalizujte up i cross-selling.

Nákupní košík a webové analýzy
Které produkty a služby by měly být nabídnuty zákazníkům? A za jakých podmínek? Volby vašich zákazníků vám dávají odpovědi.

Další scénáře CRM
Využívání dolování dat v analytickém CRM pro detekci podvodů, analýzy zákaznické hodnoty či správu stížností.

Dolování dat v průmyslovém prostředí
Optimalizace
Automatizované procesy potřebují ukládat data při vysokých rychlostech, zejména v průmyslové výrobě nebo výrobě elektrické energie. Pomocí dolování dat můžete dokonce určit rozhodující parametry hromadných sběrů dat. Simulace vám ukazují, co můžete skutečně zlepšit.

Zabezpečení kvality
Sledujte celou řadu vlastností kvality současně s mapami víceřádkových kontrol. Online monitorování a prognózy v reálném čase umožňují opětovné úpravy během probíhajícího výrobního procesu.

Analýza chyb
Zjištění chyb a chybových vzorků v přípravě surovin, ve výrobním procesu nebo v hotových výrobcích. Pravidla přidružení odhalují častý výskyt různých problémů s kvalitou nebo typických chybových sekvencí. Interaktivní rozhodovací stromy umožňují flexibilní a srozumitelnou analýzu základních příčin.
Vývojové nástroje Nástroj umožňuje exportovat připravené prognostické modely v různých programovacích jazycích (např. C #, Java, SQL uložené procedury). To umožňuje, aby modely byly použity přímo v koncovém aplikaci či nástroji, například k dosažení maximálního výkonu a nemusely se nejprve přenášet data na servery přes složité infrastruktury.
Existující kódy PMML mohou být také konvertovány do různých jazyků pomocí převodníku modelů i po vytvoření modelu. Zahrnuje také aplikaci Java for MapReduce, která umožňuje používat předpovědní modely přímo v prostředí Hadoop.
Funkce analýzy v databázi také umožňuje, aby byly celé procesy analýzy analyzovány přímo databázi.

FUNKCE Optimalizace procesů

FUNKCE Text Mining

Statistika Text Mining transformuje nestrukturovaná textová data do srozumitelné a použitelné formy, kterou následně můžete zpracovat přes různé rozhodovací procesy. Ve skutečnosti jsou data v mnoha formátech a nelze je vždy přímo hodnotit. Statistické dolování textu obsahuje umožnuje vysledovat další, zdánlivě skryté informace.

Funkce pro dolování textu v programu Statistica poskytují bohatou a výkonnou sadu nástrojů. Jsou navrženy tak, aby byly vysoce efektivní a škálovatelné díky nejmodernějším technologiím, aby co nejlépe využívaly sofistikované víceprocesorové serverové systémy. Analytické nástroje lze aplikovat na textové dokumenty nebo webové stránky. Ale i z předběžně zpracovaných bitmap a zvukových souborů mohou být nestrukturované informace roztříděny, seskupeny nebo jinak zahrnuty do analýzy.

FUNKCE In-Database Analytics

S In-datrabase analytikou (vyžaduje server Enterprise Server ) lze procesy analýzy provádět externě přímo v databázích. V grafickém rozhraní projektu Statistica jsou připraveny a připojeny interní databázové analytické uzly. Tyto procesy se pak provádějí přímo v databázi a pouze výsledky jsou přenášeny uživateli. Podporované operace zahrnují: výpočet statistik a korelaci, odhad regresních modelů, vzorkování a filtrování, výběr prvků, rozhodovací stromy a mnoho dalších. Kromě klasických databází, jako jsou například Microsoft SQL Server, Teradata, Oracle a další, je podporován i Apache Hive.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Ke stažení

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení: