(+420) 732 217 132
Volejte Po - Pá: 9.00 - 16.00 hod
info@statistica.pro
Odpovíme do 1 pracovního dne
Sídlo společnosti:
ArcIT Consulting, s.r.o.
Tylova 473/27
Plzeň 3
IČ: 05689651
DIČ: CZ05689651
Kanceláře:
ArcIT Consulting s.r.o.
Zelený Pruh 95/97
140 00 Praha 4
Kurzy a semináře se konají na adrese:
Kuta a.s.
Zelený Pruh 95/97
140 00 Praha 4
Zapsána u Krajského soudu v Plzni, oddíl C, složka 33739
Představujeme vám, jak maximálně využít nástroje pro zpracování a vyhodnocení dat.
Web STATISTICA.PRO je tu, aby Vám představil nástroje a postupy, které vedou k maximálnímu využití dat, ať už ve vašem nebo korporátním byznyse. Web Vám nabídne detailní popis nástrojů společnosti TIBCO Sotware Inc. a know-how spojené s implementací těchto a dalších nástrojů do specifických odvětví podnikání.
TIBCO Software Inc. je americká společnost poskytující firmám integraci, analýzu a zpracování dat pro použití on-premise nebo v prostředí cloud computingu. Nabízí software spravující informace a podporující rozhodování a optimalizace procesů a pro více než 10 000 zákazníků. Klienti zahrnují společnosti AirFrance, KLM, Citi, Conway, ING, Marks a Spencer, Nielsen, Shell, University of Chicago Medicine, Western Union. Společnost je novým vlastníkem nástroje Statistica, společnosti StatSoft (www.statsoft.cz)
STATISTICA.PRO nabízí know-how a nástroje pro samotnou realizaci datové extrakce z různých datových zdrojů, následné vyhodnocení dat a další zpracování ve formě reportů nebo napojení na systémy třetích stran.
Využijte našich zkušeností z implementace projektu v oblasti PRŮMYSLU 4.0 a nechte si vypracovat kompletní strategii datového zpracování. Poptejte konkrétní systém, který by Vaše požadavky vyřešil nebo se přihlašte na některý z našich kurzů, který se pokročilým vyhodnocením dat zabývá.
Zanechte nám vzkaz a my se Vám ozveme:
Obnovené tradiční kurzy na celou škálu analytických metod a také na ovládání nástroje STATISTICA jsou vypsány na květen a srpen. Hlaste se přes formuláře pod vybranným kurze. V případě, že je již garantovaný termín, je u kurzu již konkrétní datum konání.
Neznáte Statisticu? Tak začněte tady:
Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších. O využití softwaru se lze dočíst v sekci Publikační činnost a v záložce Případové studie. Analytická platforma Statistica umožní organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do provozu.
Statisticu znám a chci vedět, co je nového:
Statistica 13 - je nejnovější verze analytického softwaru, která přináší mnoho významných vylepšení.
Stručný výčet těch nejdůležitějších novinek v aktuální verzi:
Možnost definovat si analytické workflow nyní pro všechny verze –rozhraní Statistica Workspace bylo významně vylepšeno a je k dispozici v každé verzi softwaru Statistica.
Manuální kroková regrese – k manuální (uživatel si sám může volit v každém kroku, které prediktory přidá, nebo odstraní) krokové logistické regresi byla přidána i klasická lineární a Coxova regrese.
Posílení dataminingových algoritmů pro řešení Statistica Data Miner – pro posílení dataminingových algoritmů byly přidány krokové modelovací techniky. Hlavní výhodou krokové výstavby modelu je možnost ručně přidávat nejdůležitější prediktory a sledovat jejich vliv na model. Funkcionalita what-if umožní definovat modely, které jsou v souladu se směrnicemi a politikou společnosti. Více informací se dočtete zde.
Nový modul pro vizualizaci dat – Statistica Interactive Visualizations & Dashboards. Jde o nový modul pro pokročilou a interaktivní vizualizaci dat, který umožní snadnou vizualizaci rozsáhlých a dynamicky se měnicích dat (obchodní data, energetika, průmysl atd.). Díky tomuto modulu budete mít neustálý přehled o vývoji klíčových údajů. Tento modul je součástí trial verze Statistica 13.
Big Data – pokročilá platforma pro analýzu těch nejrozsáhlejších datových zdrojů. Díky mnoha vylepšením (Native Distributed Analytics (NDA), analytika nad Hadoop atd.) umožňuje řešení Statistica zpracovávat obrovské objemy dat s maximální efektivitou. Více informací se lze dočíst zde.
Další informace o posledních novinkách (Edge scoring atd.) se dočtete zde, dále také na http://statistica.io.
Snadné použití
Není potřeba kódování - Pokud víte, jak používat aplikace Microsoft Windows, jako je Excel nebo Word, pak víte, jak používat TIBCO Statistica™.
Komplexní algoritmy pro strojové učení a text mining – Statistica
Obsahuje komplexní výběr clusteringových technik, architektury neuronových sítí, klasifikačních / regresních stromů (také nazývaných rekurzivní dělící metody), multivariační modelování (včetně MARSplines) a mnoho dalších prediktivních technik pro strukturované i nestrukturované údaje.
Tzv. Drag-and-drop UI pro snadné vkládání dat
Grafické nástroje pro vytváření dotazů usnadňují přímé napojení na externí databáze. Přehledně vytvářejí, spravují a ukládají vlastní pracovní postupy s možnostmi vyhledávání.
Bezproblémová integrace s jazyky C #, R a Python.
Pokud píšete skripty jazyce C #, R nebo Python, bude se vám Statistica líbit. Statistica přečte a zapisuje data z prakticky všech standardních formátů souborů, včetně starších a konkurenčních produktů.
Nízké náklady pro akademickou sféru
Chápeme rozpočtové omezení, kterým čelí fakulty a studenti ve vzdělávacích institucích, a proto se snažíme dělat Statisticu cenově přístupnou. Neváhejte nás oslovit pro konkrétní nabídku.
Budoucnost vašeho povolání
Protože je široce využívána mimo akademickou sféru. Zkušenosti se Statistica zvýší vaší pracovní kvalifikaci. Budete připraveni nabídnout své dovednosti do oblastí s vysokou poptávkou zahrnující populární Big Data, prediktivní analýzu, internet věcí a mnohé další.
TIBCO Statistica™ v češtině
Jediný lokalizovaný komplexní profesionální systém (aktuálně verze 12.x)
Reference a případové studie z celého světa
TIBCO Statistica™ se využívá například na Yale University, Cambridge University, ,Masarykově univerzitě v Brně, Mendelově univerzitě v Brně, ČZU v Praze, VŠCHT v Praze, UTB ve Zlíně či v Akademii věd ČR.
Kvalifikovaná školení práce s produktem i s daty
Kromě elektronické učebnice a výukových materiálů nabízíme také školení na samotné ovládání nástroje nebo na příbuzná analytická témata. Školení vedou kvalifikovaní odborníci z akademické sféry i z praxe.
Tento projekt již aplikovaly pro své studenty například Česká zemědělská univerzita v Praze, Masarykova univerzita, Mendelova univerzita v Brně, Univerzita Palackého v Olomouci, Vysoké učení technické Brno, Jihočeská univerzita v Českých Budějovicích, VŠCHT, Univerzita Karlova - 1.lékařská fakulta a další.
Akademická multilicence
Speciálně v rámci tohoto projektu existuje možnost rozsáhlého počtu instalací pro celofakultní či celouniverzitní využití.
Cena tohoto řešení je odvozena od počtu instalací a dle vybraných modulů.
Neváhejte nás kontaktovat a nechat si připravit individuální nabídku
Back-office proces
Naše technologie umožňují integrovat a v reálném čase extrahovat několik procesů najednou. Takové datové extrakce zvyšují produktivitu, snižují dobu zpracování a snižují náklady. Nabízíme zavedení parametrizovatelných workflow, pokročilé analytiky či real-timového streamování.
Řízení rizik
Poskytuje výkon a rychlost potřebnou pro výpočet rizik za zlomek nákladů oproti tradičním řešením. Inovace v oblasti veřejných a soukromých cloudových technologií umožňují urychlit rozhodovací procesy a získat tak konkurenční výhodu v celé řadě agend souvisejících s vyhodnocením rizik a to včetně: oceňování aktiv, vysokofrekvenční obchodování (HFT), management obchodních rizik a v risk reportingu.
Dohled nad platebními transakcemi
Retailové banky či banky pro správu majetku mohou výrazně redukovat míru "falešně pozitivních" nálezů, a to pomocí schopností strojového učení. Dokážeme modely přizpůsobit jednoduchým přidáním nových atributů nebo změnou klíčových parametrů.
Jaké produkty můžeme doporučit:
Kurz se věnuje práci s modulem analýza síly testu. Posluchači se dozví, na jakém principu je stanoven minimální rozsah vzorku dat pro dosažení konkrétního typu testu o dané síle, jak tento odhad získat, jak v TIBCO Statistica stanovit sílu testu.
Určení velikosti vzorku je jeden z důležitých kroků před provedením jakéhokoli experimentu či studie a může ušetřit spoustu problémů vzniklých vyhodnocováním nesprávně navrhnuté studie.
Úvod
Princip testování hypotéz
Vybrané statistické testy a jejich použití
Určení síly testu
Určení minimálního rozsahu vzorku dat
Vhodné je absolvovat před tímto kurzem některý kurz zahrnující teorii testování hypotéz:
Základní kurz statistiky I,
Analýza rozptylu.
Jelikož kurz pokrývá nejrůznější metody testování hypotéz, mohou být pro účastníky zajímavé kurzy detailně rozebírající teorii k daným testům. Například:
Analýza rozptylu,
Analýza přežití,
Analýza kategoriálních dat,
Základní kurz statistiky,
Statistika v lékařství I.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Cílem jednodenního kurzu je seznámit účastníky se základními statistickými metodami používanými v analýze přežití. Kurz je určen především zájemcům, kteří se zabývají biomedicínským výzkumem, ale i jinými oblastmi, kde se pracuje s neúplnými (cenzorovanými) daty týkajících se dob do sledované události. Všechny probírané metody budou procvičeny na konkrétních příkladech.
Úvod
Úvod do analýzy přežití
Jednovýběrový problém
Srovnání dvou skupin
Regresní analýza
Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.
Kurz Analýza přežití je speciální kurz pro specifický typ dat a pokrývá základ této problematiky, stejně jako funkcionality softwaru, navazující kurz na stejné téma tedy není. Pro vzdělávání v dalších oblastech analýzy dat si můžete vybrat z nabídky našich kurzů podle problematiky, kterou hledáte.
Vzhledem k častému využití v medicíně můžeme doporučit následující kurzy:
Analýza rozptylu,
Statistika v lékařství II,
Analýza síly testu ve STATISTICA.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Tento jednodenní kurz je určen těm, kteří se zajímají o možnosti získávání a vyhodnocování informací z textových dokumentů, nejčastěji z webových zdrojů, ale i ze souboru textových dokumentů nebo různých databází. Cílem kurzu je ukázat možnosti jak pracovat s vágními textovými informacemi a jak z nich získat užitečnou informaci pro další zpracování a rozhodování. Využití text miningu lze spatřovat například v oblasti sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.
Úvod
Účel, princip a zdroje text miningu
Nastavení podmínek pro prohledávání a nastavení filtrů
Vytvoření a práce s indexovým souborem a frekvenční maticí
Výběr významných příznaků (prediktorů) pro klasifikační úlohu
Klasifikace
Shluková analýza nad získanými daty
Logickým navázáním na kurz je detailní vysvětlení metodologie, jak používat výsledky z textminingové analýzy.
Vhodnými tedy mohou být kurzy:
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Cílem jednodenního kurzu je seznámit účastníky se základními statistickými metodami určenými pro řešení problémů zahrnujících kategoriální (kvalitativní) data. Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech. Důraz je kladen na praktické použití daných metod a na interpretaci výsledků.
Úvod
Popisná statistika
Statistické metody pro proporce
Analýza závislosti dvou dichotomických znaků (kontingenční tabulky 2x2)
Analýza závislosti dvou obecných kategoriálních znaků (kontingenční tabulky IxJ)
Statistické metody pro párová kategoriální data
Loglineární modely pro kontingenční tabulky (nástin)
Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.
Přímo navazujícím kurzem je kurz:
Logistická, multinomická a ordinální regrese.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Cílem tohoto jednodenního kurzu je představit metody pro porovnávání dvou a více skupin. Kurz se zabývá modely analýzy rozptylu (jednoduché, dvojné třídění, hierarchická ANOVA), zobecněním ANCOVA či MANOVA a alternativními neparametrickými metodami. Prostor je věnován i metodám pro ověření předpokladů a post-hoc testům pro mnohonásobná porovnání.
Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech.
Úvod
Úvod do analýzy rozptylu
Metody analýzy rozptylu
Neparametrické metody analýzy rozptylu
Post-hoc testy
Je vhodné absolvovat Základní kurz statistiky I či kurz Statistika v lékařství I.
především s přihlédnutím na konkrétní typ analýz, které chce uživatel vykonávat.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Dvoudenní kurz je určen všem, kteří chtějí porozumět metodám pro analýzu a modelování časových řad. Po úvodním seznámení se základními pojmy budou vysvětleny nejrůznější metody, které umožňují predikovat chování časových řad do budoucnosti a také ohodnotit správnost výsledků. Vše je demonstrováno na příkladech z praxe.
Úvod
Úvod do časových řad
Stacionární procesy
Exponencionální vyrovnávání
ARMA modely
Nestacionární a sezonní modely
Základní kurz statistiky I.
Tématiku časových řad také částečně pokrývají dataminingové metody, konkrétně neuronové sítě, je tedy možné navštívit také kurzy:
Data mining (dvoudenní varianta) nebo
Data mining (třídenní varianta) nebo
Neuronové sítě.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Cílem jednodenního kurzu je seznámit posluchače s nejpoužívanějšími regresními modely pro dichotomickou (0/1), ordinální a multinomickou (kategoriální) odezvu. Posluchačům bude vysvětlen pojem poměru šancí (odds ratio) a jeho vztah k logistické regresi, jež umožňuje modelovat závislost 0/1 odezvy (typicky indikátoru zda nastala nebo nenastala nějaká událost) na kvalitativních i kvantitativních prediktorech obdobně jako v klasické lineární regresi. Model logistické regrese bude postupně dáván do souvislosti s klasickými postupy (dvouvýběrový t-test, analýza rozptylu, lineární regrese). V další části kurzu navážeme multinomickým logistickým modelem (multinomial logit model, umožňuje modelovat kategoriální odezvu) a dále modelem proporcionálních šancí (proportional odds model).
V poslední části ukážeme využití logistické regrese k vytvoření binárního klasifikátoru (diagnostický test) a vysvětlíme související pojmy sensitivity, specificity, pozitivní a negativní prediktivní hodnoty, ROC křivky. Jednotlivé metody budou ilustrovány na příkladech z lékařského i bankovního prostředí (credit skóring).
Úvod
Inference o proporci (stručně, je též obsahem kurzu „Analýza kategoriálních dat“)
Kvantifikace odlišnosti dvou skupin vzhledem k proporci
Jednoduchá logistická regrese
Vícenásobná logistická regrese
Multinomická logistická regrese
Model proporcionálních šancí
Logistická regrese k vytvoření binárního klasifikátoru
Doporučujeme absolvovat kurz Analýza kategoriálních dat, na který kurz Logistické, ordinální a multinomické regrese logicky navazuje.
Tématiku regresních modelů pro spojité veličiny je možné doplnit kurzy:
Analýza rozptylu,
Regresní analýza.
Možností, jak předpovídat kategorickou odezvu, je více. Mohou se hodit například dataminingové metody:
Klasifikační a regresní stromy nebo
Data mining (dvoudenní varianta) .
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Kurz je zaměřen na statistické metody, které nevyžadují nutně splnění předpokladů o pravděpodobnostním rozdělení náhodných veličin (normální, atd.), případně i jiných předpokladů. Tyto metody lze tedy univerzálně využívat napříč všemi obory. Kurz je určen všem, kteří se chtějí dozvědět o neparametrických alternativách klasickým testů.
Testy normality
Odlehlá pozorování
Popisná statistika
Neparametrické testy
Spearmanův korelační koeficient
Základní kurz statistiky I nebo Statistika v lékařství I.
Je možné rozšířit si znalosti o parametrických metodách a to prostřednictvím kurzů:
Analýza rozptylu,
Regresní analýza,
Základní kurz statistiky II.
Co se týče navázáním metodami, které nemají tak striktní předpoklady, pak lze doporučit pro regresní a klasifikační úlohy dataminingové metody:
Klasifikační a regresní stromy,
Neuronové sítě nebo
Data mining (dvoudenní varianta).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Dvoudenní kurz Praktická analýza dat je určen těm, kteří potřebují s analýzou začít, ale Základní kurz statistiky I má pro ně příliš širokou osnovu. Tento kurz klade důraz na procvičování samostatných úloh týkajících se zpracování dat z různých oblastí lidské činnosti. Podrobněji budou vysvětlena témata typy proměnných, popisná statistika, vizualizace výsledků, vztahy proměnných a interpretace výsledků.
Úvod
Úvod do analýzy dat
Popisná statistika
Vztah dvou veličin
Vybrané pokročilejší metody
Jedná se o úplně nejzákladnější kurz, není potřeba tedy absolvovat žádné předchozí kurzy.
Navazujícím kurzem pro komplexní obecné vzdělávání je:
Základní kurz statistiky II, případně Základní kurz statistiky I, nicméně ten se částečně s kurzem Praktické analýzy dat překrývá.
Pokud si chcete rozšířit znalosti konkrétní problematiky, pak je pro Vás k dispozici celá řada specializovaných kurzů jako jsou:
Analýza rozptylu,
Regresní analýza,
Neparametrická statistika,
Analýza kategoriálních dat,
Vícerozměrné statistické metody,
Časové řady a predikce.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Příprava a zpracování dat patří mezi nejpracnější úkoly celého procesu analýzy dat. Tento jednodenní kurz Vám pomůže podrobně se seznámit s obsluhou softwaru TIBCO Statistica při přípravě datového souboru. Během kurzu bude účastník seznámen se základními postupy přípravy datového souboru před započetím vlastní analýzy. Bude prezentována široká škála postupů a funkcí, které umožňují průzkum datového souboru, úpravu dat, simulace chybějících hodnot, filtrace dat, vzorkování. Jedná se o vhodné doplnění znalostí k základním kurzům či kurzu data miningu.
Úvod
Plánování výzkumu
Datová reprezentace
Očištění dat
Úpravy dat
Vzorkování
Tento kurz může doplnit znalosti z kurzů:
Základní kurz statistiky I či Praktická analýza dat. Pro absolvování nicméně tyto kurzy nejsou nutné.
Předzpracování dat je také velmi důležité pro oblast data miningu, tedy pro kurzy:
Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).
Navazujícím kurzem může být kterýkoli kurz zaměřující se na statistické metody.
Ať už je to:
Základní kurz statistiky II, Analýza rozptylu,
či další.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Regresní analýza je jednou z nejpoužívanějších a nejrozšířenějších statistických metod vůbec. Jednodenní kurz je zaměřen zejména na modely lineární a nelineární regrese. Vzhledem k univerzálnímu použití těchto výzkumných technik je kurz určen pro široký okruh zájemců různého zaměření - přírodní vědy, technické obory, biomedicínský výzkum, ekonomické a sociální vědy atd. Všechny probírané metody budou procvičeny na konkrétních příkladech.
Úvod
Úvod do regresní analýzy
Lineární regresní modely
Nelineární regresní modely
Základní kurz statistiky I nebo Statistika v lékařství I.
Tématiku regresních modelů pro jiné než spojité veličiny je možné doplnit kurzy:
Analýza rozptylu,
Logistická, ordinální a multinomická regrese.
Možností, jak řešit regresní úlohu je více, mohou pomoci například dataminingové metody:
Klasifikační a regresní stromy,
Neuronové sítě nebo
Data mining (dvoudenní varianta).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Dvoudenní kurz poskytne účastníkům přehled metod využívaných při explorativní analýze dat. Použitelnost těchto metod je velmi široká, sociálními vědami počínaje a hospodářstvím či marketingem konče. Všechny probírané metody (viz program kurzu) budou procvičeny na příkladech.
Účastníci si tak osvojí nejen znalost principů, ale i dovednost uplatnit metody v praxi. Kurz je rovněž vhodný pro uživatele systému STATISTICA, kteří se chtějí podrobněji seznámit s modulem STATISTICA Vícerozměrné průzkumné techniky.
Úvod
Analýza hlavních komponent (Principal Component Analysis)
Faktorová analýza (Factor Analysis)
Shluková analýza (Cluster Analysis)
Diskriminační analýza (Discriminant Analysis)
Kanonická korelace (Canonical Correlation Analysis)
Vícerozměrné škálování (Multidimensional Scaling)
Klasifikační stromy (Classification Trees)
Vhodné je absolvovat tento kurz, nicméně není podmínkou:
Základní kurz statistiky I.
Také účastníci kurzu Základní kurz statistiky II mohou kurzem vícerozměrných metod rozšířit své znalosti.
Kurzem pro další studium řešení podobných úloh může být kurz:
Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Základní kurz statistiky I Vám zprostředkuje pohled do světa statistických analýz. Cílem kurzu je naučit se efektivně získávat informace z dat a porozumět filozofii statistického zpracování dat. V úvodu jsou účastníci seznámeni s principy používání programu TIBCO Statistica, obsluhou jeho jednotlivých nástrojů a vybranými vhodnými funkcemi a vlastnostmi. Podrobněji budou vysvětlena témata popisná statistika, principy statistického usuzování a interpretace výsledků. Druhá část kurzu se věnuje statistickému rozhodování a vyšetření závislosti mezi proměnnými. Pro snazší pochopení dané problematiky budou v průběhu kurzu řešeny úlohy na reálných datech. Důraz je kladen na interpretaci výsledků a grafické možnosti systému TIBCO Statistica.
Kurz je určen zejména pro ty, kteří se statistickou analýzou dat začínají. Převážná část kurzu je věnována statistickému testování hypotéz (komparativní, párový pokus) parametrickými i neparametrickými testy, je proto vhodný také pro vědecké pracovníky, kteří si potřebují své postupy ujasnit/ potvrdit.
Pokud se chce posluchač plně soustředit na teorii, pak je výhodné před tímto kurzem absolvovat kurz:
Ovládání programu Statistica.
Navazujícím kurzem pro komplexní obecné vzdělávání je:
Základní kurz statistiky II.
Pokud si chcete rozšířit znalosti konkrétní problematiky, pak je pro Vás k dispozici celá řada specializovaných kurzů jako jsou:
Analýza rozptylu,
Regresní analýza,
Neparametrická statistika,
Analýza kategoriálních dat,
Vícerozměrné statistické metody,
Časové řady a predikce.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Kurz je zaměřen zejména na obecné lineární modely (vícerozměrná regrese, analýza rozptylu) a na možnosti nelineárního modelování. Všechny probírané metody jsou procvičeny na konkrétních příkladech, vše s důrazem na praktické použití daných metod a interpretaci výsledků. Kurz je rovněž vhodný pro uživatele systému TIBCO Statistica, kteří se chtějí podrobněji seznámit s modulem STATISTICA Pokročilé lineární a nelineární modely.
Úvod
Zpracování a příprava dat
Regresní analýza
Analýza rozptylu
Úvod do vícerozměrných statistických metod
Úvod do časových řad
Vhodné je absolvovat následující kurz, nicméně to není podmínkou:
Základní kurz statistiky I.
Navazujícími kurzy mohou být například kurzy, které rozšiřují a doplňují znalosti nabyté v tomto kurzu:
Vícerozměrné statistické metody,
Časové řady a predikce,
Analýza rozptylu,
Regresní analýza, Logistická, multinomická a ordinální regrese.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Kvalitativní a ordinální data jsou součástí téměř každého kvantitativního výzkumu ve společenských vědách, kde data jsou vesměs získávána pomocí dotazníkových šetření nejrůznějšího typu. Kvalitativní data jsou zde typicky výsledkem dotazníkového šetření s “multiple choice” položkami, k ordinálním datům potom vedou např. šetření s Likertovými položkami. Ve své první části si dvoudenní kurz Statistika ve společenských vědách klade za cíl seznámit účastníky s klasickými metodami statistické analýzy takovýchto dat. Na programu budou nejprve metody popisné statistiky, jejichž použití je smysluplné v kontextu kvalitativních a ordinálních dat. Následně se zaměříme na metody umožňující vyhodnotit statistickou odlišnost mezi dvěma či více skupinami vzhledem ke kvalitativní, resp. ordinální odezvě. Například v kontextu pedagogického výzkumu budeme poté schopni vyhodnotit, zda existují průkazné rozdíly mezi výsledky žáků na školách různého typu (např. víceletá gymnázia a druhý stupeň základních škol). Dále se budeme zabývat metodami pro párová kvalitativní a ordinální data, které nám umožní vyhodnotit kupříkladu vliv intervence (změna učebního postupu, …) na odezvu (studijní výsledky).
Nevhodně či dokonce špatně sestavené dotazníkové šetření může vést ke zcela nepoužitelným datům, proto se budeme věnovat také položkové analýze dotazníkového šetření, která umožní posoudit míru vnitřní konzistence jednotlivých položek dotazníku.
Druhá hlavní část kurzu bude věnována zejména metodám statistické analýzy vícerozměrných dat. V kontextu kvantitativního výzkumu ve společenských vědách je často zjišťováno nemalé množství proměnných, kdy cílem je zjistit vazby mezi jednotlivými proměnnými současně. V první řadě se seznámíme s metodami, které umožní v přehledné formě reprezentovat či vizualizovat sesbíraná data. Půjde zejména o analýzu hlavních komponent, faktorovou analýzu, korespondenční analýzu, či vícerozměrné škálování. Soustředíme se také na vyhodnocení síly vztahu mezi dvěma skupinami proměnných pomocí kanonických korelací, které lze považovat za vícerozměrnou analogii klasického korelačního koeficientu. Nebude chybět také seznámení s metodami, pomocí nichž lze provádět klasifikaci jednotek (případů) na základě vícerozměrných dat. Půjde zejména o klasické metody diskriminační a shlukové analýzy a klasifikačních stromů.
Všechny metody budou ilustrovány na analýzách dat z různých společensko-vědních oborů pomocí modulů software TIBCO Statistica. Cílem je zejména vytvořit u účastníků kurzu dobrou představu o použití jednotlivých metod.
Úvod
Metody pro kvalitativní a ordinální data
Položková analýza dotazníkových šetření
Vícerozměrné statistické metody
Klasifikační metody
Vhodné je absolvovat Základní kurz statistiky I.
Účastníky mohou zajímat kurzy:
Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Tento dvoudenní kurz je určen všem těm, kteří ve své výzkumné či jiné práci s medicínským zaměřením potřebují provádět jednodušší statistické analýzy. Na konkrétních příkladech s lékařskou tématikou budou postupně probrány statistické metody, které bývají náplní jednosemestrálních přehledových kurzů biostatistiky na lékařských fakultách či vysokých školách přírodovědného zaměření. Zatímco v těchto kurzech je důraz často kladen na matematické detaily jednotlivých statistických postupů, hlavním cílem našeho kurzu je zaměřit se na získání dovednosti identifikovat pro konkrétní problém správnou statistickou metodu a po jejím provedení pomocí software TIBCO Statistica následně správně interpretovat její výsledky.
Úvod
Základní statistické pojmy, využití statistiky v medicíně
Popisná statistika pro kvalitativní data, jejich grafická prezentace
Popisná statistika vhodná při zkoumání závislosti mezi dvěma znaky (proměnnými)
Základní pojmy statistické inference
Porovnání dvou či více skupin vzhledem ke kvalitativnímu znaku
Porovnání dvou či více skupin vzhledem ke kvantitativnímu znaku
Základy lineární regrese
Shrnutí
Doporučujeme před kurzem absolvovat kurz Ovládání programu Statistica, aby se posluchač mohl plně soustředit na probíranou teorii.
Nejvhodnějším kurzem je přímo navazující kurz
Dalšími kurzy, které mohou pomoci s analýzou v sektoru lékařství, jsou:
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Kurz je pokračováním statistiky v lékařství. Je určen pro lékaře a další zájemce s podobným zaměřením, kteří potřebují ke své práci analýzu dat. Účastníci kurzu se seznámí s pokročilejšími statistickými technikami používanými v lékařství. V závěru kurzu je i úvod do metodologie, která je potřeba pro psaní odborných článků a využití nástrojů medicíny založené na důkazech.
Pro tento kurz je potřeba mít znalosti v rozsahu kurzu Základní kurz statistiky I nebo Statistiky v lékařství I. Výhodné je také mít za sebou kurz Ovládání programu Statistica.
Dalšími kurzy, které mohou pomoci s analýzou v sektoru lékařství a rozšíří nabyté znalosti, jsou:
Analýza rozptylu,
Analýza síly testu,
Analýza přežití,
Analýza kategoriálních dat,
Logistická, ordinální a multinomická regrese.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Je známým faktem, že aplikace statistických metod v procesu výroby vede ke snížení variability měřených parametrů a zefektivnění výroby, a proto je tento kurz je pro Vás dobrým začátkem. Kurz je určen všem, kteří chtějí používat statistické metody v oblasti řízení kvality a průmyslu vůbec. Cílem dvoudenního kurzu je seznámit se od základu s filozofií statistického zpracování dat v průmyslu, důraz je také kladen na grafické možnosti systému TIBCO Statistica.
Tento kurz je úvodním kurzem do problematiky.
Účastníky mohou zajímat kurzy:
Základy Lean Six Sigma,
Six Sigma Green Belt.
Pokročilé úlohy z průmyslového prostředí se dají řešit skrz data mining, tedy
Data mining (dvoudenní varianta) nebo Data mining (třídenní varianta).
Pokud může automatizace postupů zjednodušit některé z procesů,pak je vhodné absolvovat kurz:
Data mining v praxi v prostředí Workspace (je samostatně nebo součástí kurzu Data mining (třídenní varianta)).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Tento jednodenní trénink je buď součástí kurzu Data mining (třídenní varianta) nebo ho lze absolvovat zvlášť jako jednodenní školení (tato varianta je vhodná především pro ty, kteří absolvovali kurz Data mining již dříve).
Prostředí pracovní plochy Workspace je uživatelské rozhraní, ve kterém je možné jednoduše a efektivně zpracovat a vizualizovat složitější pracovní postupy. I bez znalosti programovacích jazyků lze pomocí propojování uzlů (které představují jednotlivé analýzy a funkcionality, které již z programu Statistica znáte) naprogramovat kompletní a posléze automaticky spustitelnou analýzu. Také proto je toto prostředí primárně určeno pro data mining, využitelné je nicméně ve všech oblastech zpracování dat. Předpokládá se, že se toto uživatelské rozhraní díky svým vlastnostem stane postupem času primárním ovládacím prostředím programu.
Hlavní náplní kurzu jsou praktické ukázky a příklady úloh z oblasti data miningu či úloh, kde je možné výhodně využít funkcionality prostředí Workspace. Účastníci si budou během kurzu postupy sami zkoušet a tvořit spolu s lektorem na svém počítači.
Úvod
Obsluha prostředí Workpace
Praktické aplikace
Customizace a usnadnění práce
Kurz částečně čerpá ze znalostí kurzu
Data mining (dvoudenní varianta)
Výhodné, ale ne nutné je také absolvovat kurz:
Ovládání programu Statistica.
Prostředí Workspace může být vnímáno a používáno jako nástroj pro programování. V případě, že potřebujete detailněji programovat své vlastní funkcionality a aplikace, můžeme doporučit kurz Statistica Visual Basic.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Tento dvoudenní kurz je určen osobám, které chtějí odhalit informace a znalosti ukryté v datech. Cílem tohoto kurzu není ukázat jen vhodné postupy, ale také způsob, jak co nejlépe prezentovat výsledky. V průběhu kurzu budou prezentovány nejrůznější techniky: korelační analýza, regresní analýza, časové řady, klasifikační stromy, neuronové sítě a další. Na závěr budou ukázány konkrétní příklady z oblasti vytěžování dat. V průběhu celého kurzu budou účastníci pracovat s modulem Statistica Data Miner.
Úvod
Úvod do vytěžování dat, produkt
Práce s recepty (wizardem)
Klasifikační a regresní stromy
Lineární modely
Metody shlukování
Automatizované neuronové sítě
Metody strojového učení
Analýza nezávislých komponent (ICA)
Text Mining
Nasazení modelů na reálná data z praxe
Kvalita získaných modelů
Metody výběru vhodných příznaků
Sdružování rozsáhlých skupin hodnot příznaků (Binning)
Základy práce v pracovní ploše (Workspaces)
Běžná obsluha počítače v prostředí Windows, doporučujeme před tímto kurzem absolvovat Základní kurz statistiky I.
Doporučujeme před tímto kurzem absolvovat kurz:
Základní kurz statistiky I.
Spolu s dvoudenním kurzem Data mining doporučujeme absolvovat i kurz Data mining v praxi v prostředí Workspace.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Tento třídenní kurz je balíčkem kurzů Data mining (dvoudenní varianta) a Data mining v praxi v prostředí Workspace. V prvních dvou dnech se dozvíte o využití a pozadí data miningových metod, ve třetím dni se pak naučíte pracovat v prostředí pracovní plochy Workspace, která je nejvhodnějším uživatelským rozhraním pro zpracovávání dataminingových úloh. Nabyté znalosti Vám usnadní praktickou aplikaci data miningu na Vaše data a ukáží opravdovou sílu modulu Statistica Data Miner.
Pro kompletní program kurzu se prosím podívejte na stránky kurzů Data mining (dvoudenní varianta) a Data mining v praxi v prostředí workspace. Tento kurz je spojením obou kurzů.
Běžná obsluha počítače v prostředí Windows, doporučujeme před tímto kurzem absolvovat Základní kurz statistiky I.
Doporučujeme před tímto kurzem absolvovat kurz:
Základní kurz statistiky I.
Výhodné je také absolvovat kurz:
Ovládání programu Statistica.
Navázat můžete podle oboru a povahy problému, který zkoumáte, nějaký univerzální navazující kurz není k dispozici.
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Rozhodovací stromy jsou jednou z nejpoužívanějších technik data miningu. Kurz je určen těm, kteří se zajímají o klasifikaci dat (například credit scoring, kdy se na základě příznaků snažíme rozhodnout o zařazení vzorů do skupin) nebo se věnují regresním úlohám včetně predikcí časového vývoje. Kurz seznámí účastníky nejen s klasickými metodami, ale i s pokročilejšími stromovými strukturami jako jsou Boosting Trees nebo Random Forests. Součástí kurzu je i interaktivní tvorba vlastních stromů a jejich modifikace.
Úvod
Příprava dat STATISTICA
Výběr důležitých prediktorů pro požadovanou úlohu
Sdružování rozsáhlých skupin hodnot příznaků (binning)
Klasifikační a regresní stromy
Metody
Vyhodnocení kvality vytvořeného modelu
Nasazení modelu v praxi
Hierarchické shlukování a jeho souvislost s klasifikačními a regresními stromy
Základy práce v prostředí modulu Statistica Data Miner
Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:
Data mining v praxi v prostředí Workspace.
Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro klasifikační a regresní stromy, pak doporučujeme kurzy:
Neuronové sítě,
Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Neuronové sítě patří mezi oblíbené moderní techniky, které umožňují nový a často i efektivnější přístup pro zpracování dat. Dvoudenní kurz umožňuje seznámení jak s teoretickými principy fungování neuronových sítí, tak s jejich praktickou aplikací prostřednictvím modulu STATISTICA Automatizované neuronové sítě. Kurz poskytne přehled o architektuře neuronových sítí a metodách učení. Postup, jak dosáhnout pomocí neuronových sítí co nejlepších výsledků, bude demonstrován při řešení praktických úloh.
Úvod
Práce s recepty (wizardem)
Práce s recepty (wizardem)
Principy neuronových sítí
Práce s neuronovými sítěmi
Využití neuronových sítí
Metody výběru vhodných příznaků
Sdružování rozsáhlých skupin hodnot příznaků (binning)
Vyhodnocení kvality vytvořeného modelu
Nasazení modelu v praxi
Práce v prostředí modulu STATISTICA Data Miner
Běžná obsluha počítače v prostředí Windows
Není nutné absolvovat před tímto kurzem jiné kurzy, nicméně znalost základů statistického uvažování je vhodná.
Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:
Data mining v praxi v prostředí Workspace.
Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro neuronové sítě, pak doporučujeme kurzy:
Klasifikační a regresní stromy,
Data mining (dvoudenní varianta) nebo Data mining(třídenní varianta).
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Tento jednodenní kurz je určen těm, kteří se zajímají o možnosti získávání a vyhodnocování informací z textových dokumentů, nejčastěji z webových zdrojů, ale i ze souboru textových dokumentů nebo různých databází. Cílem kurzu je ukázat možnosti jak pracovat s vágními textovými informacemi a jak z nich získat užitečnou informaci pro další zpracování a rozhodování. Využití text miningu lze spatřovat například v oblasti sledování trendů technologického vývoje, vyhodnocování konkurence, zákaznické vnímání vlastní společnosti apod.
Úvod
Účel, princip a zdroje text miningu
Nastavení podmínek pro prohledávání a nastavení filtrů
Vytvoření a práce s indexovým souborem a frekvenční maticí
Výběr významných příznaků (prediktorů) pro klasifikační úlohu
Klasifikace
Shluková analýza nad získanými daty
Logickým navázáním na kurz je detailní vysvětlení metodologie, jak používat výsledky z textminingové analýzy.
Vhodnými tedy mohou být kurzy:
Účastník získá certifikát o úspěšném absolvování kurzu.
Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.
Popis typů licencí
Jednotlivé produkty (analytické balíčky Professional, Expert - Quality Control, Expert - Data Science, Enterprise) lze kombinovat s určitým typem licence. Licence se od sebe odlišují typem instalace, počtem přistupujících uživatelů a specifickými funkcemi (možnosti reportování, přístup přes web apod.). Cílem následujícího textu je představit si jednotlivé typy licencí, které lze pořídit.
Umožňuje instalovat software na konkrétní počítač a na něm ho následně provozovat. Licence je vázaná na uživatele, nikoliv na pracovní stanici. V případě potřeby změny počítače (poruchy, novější PC) se provede „odregistrace“ licence a následně je možné software nainstalovat na jiný PC.
Pro koho je určena:
Tato licence se využívá celosvětově na výzkumních pracovištích, v laboratořích, malých firmách, apod. Je využitelná všude tam, kde je koncový uživatel pouze jeden. Velmi oblíbená je na akademické půdě pro jednotlivé studenty / pedagogy / výzkumní pracovníky.
Dostupná pro produkty:
Dostupné časové provedení:
Výhody:
Smyslem síťové licence je flexibilní využití softwaru Statistica pro široké spektrum pracovních stanic v rámci instituce. Software lze nainstalovat na libovolný počet pracovních stanic, které jsou spojeny lokální sítí. Rozhoduje počet současně přistupujících uživatelů, který je dám počtem zakoupených licencí (licence „plavou“ mezi pracovními stanicemi dle aktuálního využití software uživateli). Prakticky je tedy počet uživatelů, kteří při této licenci mají možnost se softwarem pracovat, neomezený.
Pro koho je určena
Tato licence je využívaná v společnostech z nejrůznějších oblastí lidské činnosti, kde existuje vícero uživatelů – bankonvictví, průmysl, výzkum, marketing, utility, atd. Také je ve velké míře využívaná ve výzkumních institucích napříč výzkumnými týmy a odděleními, na univerzitách v rámci kateder, nebo celých fakult. Velmi oblíbené je využití v učebnách univerzít, kde tento typ licence umožňuje komfortní a pohodlnou administraci.
Při tomto typu licence lze kombinovat jednotlivé produkty softwaru a zakoupit tak konfiguraci přesně podle toho, jak bude program využíván. Lze tedy optimalizovat náklady na licence podle potřeb a počtu uživatelů.
Dostupná pro produkty:
Dostupné časové provedení:
Výhody:
Technické detaily licence
Tento typ licence sestává z instalace síťového Statistica serveru, což může být i obyčejný průměrný počítač. Tento licenční Statistica server v sobě obsahuje ověřování licencí licenčním manažerem (FLEXlm ) a také soubory nutné pro spuštění softwaru. Plovoucí licence umožňuje následující způsob spouštění aplikace Statistica:
V obou síťových verzích probíhají výpočty na klientských stanicích. Klientskou stanicí však může být i výkonný server ve společnosti. Způsob práce ilustruje následující schéma. Schéma ilustruje i možnost odpojení počítače od vnitřní sítě a využívání řešení mimo síť (na služební cestě, prezentací na konferenci atd.).
TIBCO Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších. Analytická platforma Statistica umožní organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do provozu.
Produkty (balíčky) TIBCO Statistica
Produkty jsou balíčky funkcionalit a rozšíření základního nástroje. Většinu analytických metod najdete ve verzi Professional. Specifické rozšíření jsou potom spojena s balíčky určenými na konkrétní aplikaci. Čtěte dále pod záložkou produkty.
Každý balíček může být dodán v různých licenčních formách. Více na téma licence.
Funkce |
Professional |
Expert
Quality Control |
Expert
Data Science |
Enterprise |
Základní statistiky a vizualizace | ||||
Pokročilá statistika | ||||
Průmyslová statistika | ||||
Reportovací tabulky | ||||
Vizualizační panely | ||||
Vícerozměrné statistiky | ||||
Porovnávací metody |
* |
* | * |
* |
Analýza přežití |
* |
* | * |
* |
ETL | ||||
Modul tvorby pravidel | ||||
PI konektor | ||||
Variace | ||||
Testování hypotéz | ||||
Data Mining | ||||
Vývojové nástroje | ||||
Optimalizace procesů | ||||
Text Mining | ||||
In-Database Analytics |
** |
* Tyto moduly můžou být dodatečně licencovány „al carte“
** In-Database Analytics jsou doplňkem Statistica Serveru.
Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:
Professional
Je základní verzí programu Statistica. Nabízí celé spektrum klasických statistických metod včetně reportingu a vizualizace. Pomocí intuitivního rozhraní založeného na standartních windows ikonách mohou být analýzy jasně strukturovány, snadno automatizovány a znovu použity. Díky přívětivému uživatelskému rozhraní je produkt vhodný pro příležitostné analytiky dat. Statistica Professional je vhodným nástrojem pro každého uživatele, který chce provádět základní nebo pokročilé analýzy a vizualizace na své lokální stanici.
Expert – Quality Control (DOPORUČUJEME)
Tento produkt obsahuje všechny funkce verze Statistica Professional. Navíc jsou v nabídce speciální možnosti ETL(extract, transform a load) a specifické přístupy k datům. Díky funkci Tvorba pravidel mohou být analýzy dat automatizovány na přehledném dashboardu, kde můžete sledovat i upravovat definovaná pravidla v reálném čase. Tento produkt je vhodný pro analýzu dat ve výrobních podnicích a v technických procesech. Je vhodným základním kamenem pro naplnění iniciativy v rámci zavedení prvků INDUSTRY 4.0 (více k tématu zde) a to v jakémkoli odvětví, kde chcete získat informace prostřednictvím vizualizací a analýz založených na heterogenních datových zdrojích a požadavcích založených na pravidlech. K dispozici jako stolní, síťová a serverová verze, díky které může být Statistica Expert – Data Science rozšířena na celopodnikový analytický systém.
Expert - Data Science
Pokud jde o pokročilou analytiku, což znamená zejména výpočet prediktivních modelů pro různá strategická rozhodnutí založená na datových údajích nebo průzkumu velkých dat, je jasnou volbou Statistica Expert - Data Science. Nabízí kromě klasických metod statistické analýzy všechny důležité metody předběžné analýzy od přípravy dat, modelování až po definované nebo parametrizovatelné predikční modely. Zkušený vědecký pracovník využívá intuitivní rozhraní Statistica k vytváření a implementaci komplexních procesů analýzy. Statistica Expert - Data Science je dostupná v desktopových, síťových a serverových verzích a může být nasazena jako celopodnikový analytický systém.
Statistica Enterprise
Funkce verze Statistica Enterprise přesahují rámec Statistica Expert – Quality Control a Statistica Expert - Data Science. Jsou nabízeny metody pro optimalizaci procesů a licence umožňuje importovaní či exportování modelů do jiných formátů, aby mohly být začleněny do aplikací třetích stran a použity nezávisle na Statistice. Verze Statistica Enterprise je k dispozici na koncových stanicích, v síťové licenci a v serverových verzích a může být nasazen jako celopodnikový analytický systém. Serverová verze umožňuje kompletní automatizaci procesů a správu všech analytických procesů v podniku, včetně přístupu k datům, analýzám, přehledům a distribucím informací.
Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:
Data, data, data - žádná společnost bez nich nemůže fungovat. Pro jejich využití v rozhodovacích procesech je zapotřebí vhodných nástrojů pro analýzu. To platí nejen pro projekty s "big daty", ale také pro jakékoli další data z databázových či transakčních systémů nebo dokonce z excelů nebo z papíru. Pro splnění těchto požadavků nabízí Statistica komplexní softwarový balík základních statistických operací a vhodných grafických výstupů. To vše doplněno intuitivním ovládáním, všestranností a příjemným pracovním prostředím podobným právě nástroji MS Excel.
Popisná statistika, strukturovaná statistika, průzkumná analýza dat
…další metody zobrazení dat
Korelace
Interaktivní výpočet pravděpodobnosti
t-testy (testy rozdílu mezi skupinami)
Tabulky rozptylů, kontingenční tabulky, tabulky se shluky, analýza více odpovědí
Vícenásobné regrese
Neparametrické statistiky
Rozdělení pravděpodobnosti
Obecné lineární modely (OLM)
Obecné regresní modely (ORM)
Statistica kombinuje standardní statistické techniky a efektivní grafiku a snadnou obsluhu. Různé "grafy kontroly kvality" umožňují jasně ilustrovat vývoj důležitých vlastností procesu měření kvality. "Analýza procesů" nabízí rozsáhlé metody pro kontrolu statistických procesů a analýzu měřicích systémů. A modul "Experiment Planning" vás pomůže při tvorbě a analýze experimentálních návrhů. Navíc "Analýza výkonu" vám umožňuje zjistit, jaké velikosti vzorku potřebujete, abyste získali smysluplné výsledky před reálným provedením.
Analýza procesů a měřících systémů (SPC, MSA)
Reportovací tabulky
Vizualizační panely
Vytvořte smysluplné panely, které vám umožní vizualizovat a shromažďovat data. Funkce drill-down ve vizualizačních panelech umožňuje vyhledávat kontexty na různých úrovních agregace a interpolovat chybějící data.
Porovnávací metody
Nejen v klinických studiích ale i v jiných oblastech, jako je například průmyslová výroba, nebo služby vyžadují způsoby, jak ověřit nebo porovnat jednotlivé výsledky a následně vyhodnotit jak zafungovala například úsporná opatření. V praxi se často používají nevhodné statistické metody, jako jsou jednoduché korelační analýzy nebo průměrná srovnání.
Porovnávací metody v nástroji Statistica kombinuje současné výpočty a vizualizační standardy porovnání metod měření. Zahrnuty jsou:
Společnosti ve farmaceutickém průmyslu používají při dlouhodobém vyhodnocení statistické metody pro výpočet doby trvanlivosti výrobku nebo či opakovaného zkoušení účinné složky podle přísných specifikací evropských regulačních orgánů. Pravidlo Q1E Mezinárodní konference o harmonizaci (ICH) obsahuje konkrétní nařízení pro statistické zpracování údajů o stabilitě, jejichž realizace vyžaduje hlubokou znalost regresní a kovarianční analýzy.
STATISTICA Add-on Analýza přežití umožňuje automatizovat výpočet trvanlivosti (skladovatelnost) a výkon účinné složky (přezkoušení období) po Q1E preferencí:
Stanovení pojmu pro jednotlivé nebo vícenásobné dávky
Analýza Covariance pro sdružování údajů
Automatické určování modelu statistickým testem na stejném vzorku a stejným zachycením funkce stability více dávek
Přepínání mezi německým a anglickým jazykem pro vstupní masky a výstupní výsledek
Automatické generování sestavy ve formátu pdf
Pomocí modulu analýza přežití můžete vyhodnocovat studie stability a na stisknutí tlačítka vytvářet archivovatelné výstupní dokumenty!
Nástroj Statistica Extract, Transform a Load ( ETL) extrahuje, transformuje a načítá data z různých zdrojů do tabulky statistik. Heterogenní zdroje dat jsou standardizovány, koordinovány a přímo přístupné další analýze.
Například data z jedné minuty z jedné databáze mohou být přiřazena k hodinovým datům jiné databáze takovým způsobem, že příslušné hodnoty měření nebo charakteristiky z obou zdrojů dat mohou být následně analyzovány dohromady. V tomto případě mohou být údaje v minutách statisticky shromažďovány různými způsoby - například sumarizací nebo zprůměrování. Další pokyny pro zpracování, jako je rozsah hodnot nebo časové filtry, které je třeba vzít v úvahu, lze pohodlně definovat pomocí uživatelsky přívětivého menu. To umožňuje flexibilní zpracování procesních dat v rámci platformy Statistica.
Nástroj ETL je speciálně optimalizován pro požadavky na vyhodnocení dat pomocí osvědčeného podnikového řešení Enterprise Server . Data, která se mají extrahovat, mohou pocházet ze standardních databází, jako jsou například databáze Oracle nebo SQL Server, soubory Statistica nebo speciální procesní databázový systém PI. Různé zdroje dat lze extrahovat, upravovat a přenášet do analytických tabulek v jednom kroku. Tento nastavený proces ETL může být zaznamenán a integrován do Enterprise Serveru , aby mohl být vyvolán a automatizován nebo později změněn.
To umožňuje analytikovi interaktivně kompilovat data z externích zdrojů v rozhraní Statistica způsobem, který je optimální pro analýzu dat. Následující analýzy dat mohou být prováděny interaktivně nebo automaticky, takže lze vytvořit automatizovaný proces od extrakce dat až po zprávu o analýze.
Neomezená tvorba parametrizovatelných pravidel a workflow
FUNKCE Variace
Testování hypotéz (WoE) usnadňuje pochopení a modelování vztahů, kde existují binární cíle. Tak je tomu v mnoha průmyslových odvětvích, bez ohledu na to, zda jde o různé cílové kategorie jako "dobré" vs. "špatný", "zdraví" vs. "Nemoc" nebo "ano" "Ne".
S testováním hypotéz jsou proměnné rekodifikovány takovým způsobem, že separační síla k závislé proměnné je maximalizována. Metrické proměnné se převádějí do tříd a kategorické proměnné se rekodují.
V praxi si lze představit, jak se úvěrová splatnost snižuje s tím, jak se doba splácení zvyšuje. Každému (různě širokým) měsíčnímu intervalu je přiřazena hodnota WoE, což znamená, že negativní hodnoty WoE znamenají nepřiměřeně mnoho úvěrových ztrát.
Hledání nejefektivnějšího řešení probíhá automaticky pomocí metody rozhodovacího stromu, a to i pro více ovlivňujících se proměnných, a může také zvládnout odlehlé a chybějící data.
Uživatelé mohou určit, zda by měly být zobrazeny složité nelineární vztahy a interakce mezi ovlivňujícími proměnnými nebo by měly být zobrazeny pouze jednoduché trendy. Pro snadnější porozumění lze použít i méně granulární klasifikaci.
Kódování WoE je vydáno ve formě pravidel, které snadno aplikujete na data pouhým kliknutím.
S testováním hypotéz můžete často získat lepší výsledky při modelování, zejména při logické regresi. Vzhledem k tomu, že metrické hodnoty WoE jsou přiřazeny k třídám nebo kódům s přímým odkazem na cílové data, není zapotřebí fiktivního či efektivního kódování (což také často zahrnuje problémy s odhadem) a usnadňuje interpretaci modelů.
Funkce Data Mining (dolování dat) nástroje Statistica obsluhuje celý proces dolování dat - od vytvoření databázového dotazu až po vytvoření metody konečné sestavy – modul je výkonný a snadno použitelný.
Funkce Data Mining nástroje Statistica se přizpůsobují vašim potřebám a znalostem. Vyberte si mezi různými aplikačními režimy, které se liší možností obsluhy a stupněm automatizace:
Data Mining často přesouvá velmi velké objemy dat a provádí komplexní výpočty modelů - proto je nezbytným předpokladem dobrá výkonnost softwaru.
S datovými funkcemi společnosti Statistica jste dobře připraveni:
Optimalizované algoritmy vyvinuté pomocí nejmodernější technologie kompilátorů, 64bitové verze pro podporu rychlejších procesorů a k distribuci procesů na více procesorech.
Optimalizovaný přístup k čtení a zápisu do velkých databází:
Procesní technologie čte data asynchronně přímo z databázových serverů.
Serverová verze také umožňuje přenos všech výpočtů na vysoce výkonné víceprocesorové počítače a také z počítače v intranetu nebo Internetu prostřednictvím webového rozhraní - tedy bez instalovaných komponent Statistica - jsou řízeny.
Nejlepší metoda pro dolování dat neexistuje. Dobrý nástroj pro dolování dat musí proto nabízet širokou škálu metod. Funkce Data Mining softwaru Statistica jsou ideální pro tyto použití:
Scénáře
Požadavky na dolování dat jsou různorodé ve všech odvětvích: Banky, pojišťovny, Mass-media, maloobchod, zásilkový obchod, e-commerce nebo telekomunikační společnosti je již úspěšně používají. Ale i průmyslová výroba, logistika, biochemie, výzkum, medicína a farmaceutický výzkum se stále setkává s potřebou dolování dat k optimalizaci procesů a zkoumání příčiny.
Tradiční data mining aplikace
zákaznická segmentace nabízí segmentaci zákazníků do skupin s podobnými sociodemografickými profily a poptávkovými modely pro cílený přístup.
Vyhodnocení rizik
Předpovědi na základě již získaných dat, aby se minimalizovalo riziko selhání. Vytvořte modely a scénáře pro hodnocení rizik. Vyhodnoťte úvěrové riziko podle Basel II.
Optimalizace marketingu
Zvyšte odezvu a návratnost investic vašich přímých marketingových kampaní: individuálním kontaktem s klientem, frekvencí zasílání a nabídkou na míru. Optimalizujte up i cross-selling.
Nákupní košík a webové analýzy
Které produkty a služby by měly být nabídnuty zákazníkům? A za jakých podmínek? Volby vašich zákazníků vám dávají odpovědi.
Další scénáře CRM
Využívání dolování dat v analytickém CRM pro detekci podvodů, analýzy zákaznické hodnoty či správu stížností.
Dolování dat v průmyslovém prostředí
Optimalizace
Automatizované procesy potřebují ukládat data při vysokých rychlostech, zejména v průmyslové výrobě nebo výrobě elektrické energie. Pomocí dolování dat můžete dokonce určit rozhodující parametry hromadných sběrů dat. Simulace vám ukazují, co můžete skutečně zlepšit.
Zabezpečení kvality
Sledujte celou řadu vlastností kvality současně s mapami víceřádkových kontrol. Online monitorování a prognózy v reálném čase umožňují opětovné úpravy během probíhajícího výrobního procesu.
Analýza chyb
Zjištění chyb a chybových vzorků v přípravě surovin, ve výrobním procesu nebo v hotových výrobcích. Pravidla přidružení odhalují častý výskyt různých problémů s kvalitou nebo typických chybových sekvencí. Interaktivní rozhodovací stromy umožňují flexibilní a srozumitelnou analýzu základních příčin.
Vývojové nástroje Nástroj umožňuje exportovat připravené prognostické modely v různých programovacích jazycích (např. C #, Java, SQL uložené procedury). To umožňuje, aby modely byly použity přímo v koncovém aplikaci či nástroji, například k dosažení maximálního výkonu a nemusely se nejprve přenášet data na servery přes složité infrastruktury.
Existující kódy PMML mohou být také konvertovány do různých jazyků pomocí převodníku modelů i po vytvoření modelu. Zahrnuje také aplikaci Java for MapReduce, která umožňuje používat předpovědní modely přímo v prostředí Hadoop.
Funkce analýzy v databázi také umožňuje, aby byly celé procesy analýzy analyzovány přímo databázi.
Statistika Text Mining transformuje nestrukturovaná textová data do srozumitelné a použitelné formy, kterou následně můžete zpracovat přes různé rozhodovací procesy. Ve skutečnosti jsou data v mnoha formátech a nelze je vždy přímo hodnotit. Statistické dolování textu obsahuje umožnuje vysledovat další, zdánlivě skryté informace.
Funkce pro dolování textu v programu Statistica poskytují bohatou a výkonnou sadu nástrojů. Jsou navrženy tak, aby byly vysoce efektivní a škálovatelné díky nejmodernějším technologiím, aby co nejlépe využívaly sofistikované víceprocesorové serverové systémy. Analytické nástroje lze aplikovat na textové dokumenty nebo webové stránky. Ale i z předběžně zpracovaných bitmap a zvukových souborů mohou být nestrukturované informace roztříděny, seskupeny nebo jinak zahrnuty do analýzy.
S In-datrabase analytikou (vyžaduje server Enterprise Server ) lze procesy analýzy provádět externě přímo v databázích. V grafickém rozhraní projektu Statistica jsou připraveny a připojeny interní databázové analytické uzly. Tyto procesy se pak provádějí přímo v databázi a pouze výsledky jsou přenášeny uživateli. Podporované operace zahrnují: výpočet statistik a korelaci, odhad regresních modelů, vzorkování a filtrování, výběr prvků, rozhodovací stromy a mnoho dalších. Kromě klasických databází, jako jsou například Microsoft SQL Server, Teradata, Oracle a další, je podporován i Apache Hive.
Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:
Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení: