A Statistica Data Scientist csomag a Desktop termék analitikai képességeit számos lehetőséggel bővíti. Tartalmazza az adatbányászat, üzleti intelligencia, ipari statisztika, folyamat optimalizálás fejlett eszközeit és a statisztikai modellek hatékony felhasználásának lehetőségét.
A Statistica Data Scientist csomag alapot ad több speciális kiegészítő (például Live Score, Product Traceability) használatához.
A csomag egyéni felhasználásához géphez kötött licenc, vagy több felhasználó számára konkurens hálózati licenc igényelhető.
A csomaghoz kiegészítésként választható Statistica Server biztosítja a vállalati munkacsoportok számára az adatbázis és webszerver alapú infrastruktúrát, a hozzáférési jogokat, a feladatok és eredmények megosztását, a validálhatóságot, a több szerveres megoldásokat.
A Statistica Data Scientist csomag komponensei:
|
A Statistica Data Scientist csomag bővítési lehetőségei:
Concurent licensing |
Kunkurens hálózati licenc |
Statistica Scorecard |
Scorecard építő és kezelő eszköz |
Statistica Server |
Adatbázis alapú rendszer jogosultság kezeléssel, alapot ad a következő további bővítésekhez: Monitoring Alerting Server, Web Data Entry, Product Traceability, Live Score, Big Data Analytics, Stability Analysis |
|
Statistica ETL:
Extract, Taransform and Load
A Statistica ETL lehetővé teszi a Statistica programok hatékony adatfeldolgozó, szűrő, aggregáló képességeinek kihasználását speciális adatforrások esetén is.
A program segítségével összegyűjthetők és elemzéshez optimalizált formában, adattárházba tölthetők az általánosan használt Microsoft SQL, Oracle adatbázisokból és az eltérő felépítésű, konvertálást igénylő, speciális formátumú forrásokból (mint például a folyamat adatokat tároló OSI Pi) származó adatok.
A rendszer fő funkciói:
-
Extract.
Hatékony platform a több
adatbázisból érkező adatok,
metaadatok kezelésére
-
Transform.
Egyedülálló eszköztár a
hagyományosan nehezen kezelhető
konverzióval, időbélyeg vagy
azonosító alapú egyeztetéssel,
egyesítéssel járó adatfeldolgozási
műveletekhez
-
Load.
Az előző lépésekben gyűjtött és
előkészített adatok adattáblákba
töltése, további vizsgálatra kész
formátumban
A Statistica
ETL a gyártási adatok előfeldolgozásával
elhárítja az eltérő mintaelemszámokból
eredő problémákat, amelyek például a PLS/PCA
modellre épülő minőségellenőrzésnél vagy
a Statistica Server valós
idejű vizsgálatainál jelentkeznek. Egy
másik tipikus alkalmazási terület az
eltérő időközönként mért gyártási adatok
egyeztetése, akár a gyakrabban rögzített
adatok összesítésével, akár a ritkábban
mértek ismétlésével (például historikus
erőművi adatok alapján a teljesítmény
vizsgálatához a percenként mért égési
jellemzőket a naponta gyűjtött üzemanyag
adatokkal).
Vissza a lap elejére
Statistica Rules Builder
A Statistica Rules Builder döntési szabályrendszer építésére, kezelésére szolgál, valamint a szabályrendszer automatikus végrehajtására.
A Statistica Rules Builder a prediktív analitikai eszközökön alapuló üzleti intelligencia alkalmazások kulcseleme: használatával felépíthető és alkalmazható az adott szervezet üzleti döntéseit meghatározó szabályrendszer (Business Rules Engine).
A prediktív analitikai modellek, a stratégiai szempontok, a törvények és helyi rendelkezések figyelembe vételével felépített működési szabályok alapján automatikus döntési javaslatokkal növeli a szervezetek döntési hatékonyságát. A korábbi események statisztikai elemzése segít az üzleti célok, majd a működési szabályok pontosításában, ezáltal az ügyfelek megtartásában, a teljesítmény növelésében, a kockázatok csökkentésében és még sok más területen.
A rendszer fő előnyei:
Minden eddiginél egyszerűbb a becslés, a tervezés és a minőségi problémák kezelése. Pontosan felmérhető a vevők, szállítók és stratégiai lehetőségek üzleti értéke
Lehetővé teszi a modell gyors módosítását, hogy az tökéletesen megfeleljen a változó követelményeknek
A bonyolult és folyamatosan frissített prediktív modelleket tartalmazó komplex döntési szabályok gyors alkalmazása a legfrissebb adatokon jelentős üzleti előnnyel jár
Iparágak széles körében eredményesen alkalmazható, megoldást jelent többek között a biztosítási és banki kockázatkezelés vagy a marketing és a gyártás területén felmerülő feladatokra.
Vissza a lap elejére Statistica Variance Estimation and Precision
Eszközkészlet a rögzített és véletlen faktorokkal végzett kísérletek eredményeinek kiértékeléséhez, a variancia összetevőinek becslésére, a precizitás meghatározására, a rögzített hatások összehasonlításához.
REML - Restricted Maximum Likelihood Estimation módszer
Új grafikonok a függőváltozók és a varianciakomponensek szemléletes ábrázolásához
Több függőváltozó rugalmas kezelése
Vissza a lap elejére
Statistica PI Connector
A Statistica programok számára elérhetővé és feldolgozhatóvá teszi az iparban széles körben használt OSIsoft PI rendszerben idősorként tárolt adatokat.
Az OSIsoft PI rendszerét a gyártási folyamatok, az energiaipar, a szolgáltatások és számos más terület alkalmazza változatos céllal, például kockázatkezeléshez vagy döntéstámogatáshoz.
A Statistica PI Connector alkalmazásával az OSIsoft PI rendszerben időbélyegekkel tárolt adatokat tallózni vagy importálni lehet, a program a különböző időpontokban rögzített értékek interpolációjával előállítja a statisztikai elemzésre alkalmas adatszerkezetet.
Vissza a lap elejére
Statistica Data Miner
Az
adatbányászati módszerek széles választékát kínálja
egy csomagban, ikon alapú, könnyű használatot
biztosító felhasználói felülettel.
A Statistica Data Miner az adatbányászat minden
alkalmazási területének megfelelő, komplex elemző
eljárásokat tartalmaz. A Statistica
programcsalád professzionális adatelérési
technológiáira, elemző és ábrázoló képességeire
alapozva kétféle lehetőséget kínál az adattömeg
vizsgálatához: közvetlenül indítható interaktív
módszereket, valamint az elemenként, grafikus
felületen felépíthető, majd beavatkozás nélkül
végrehajtható munkatervet. Az adatbányászat
eredményeként kapott modell az újabb adatok
kiértékeléséhez azonnal, vagy tárolva később, akár
más rendszerbe integrálva is felhasználható.
Az alapvető statisztikai
módszereken és adattisztító eljárásokon felül
rendelkezésre álló legfontosabb adatbányász
eszközök:
-
Feature Selection/Variable
Screening - legjobb leíró tulajdonságok keresése
-
General Slicer/Dicer Explorer
with Drill Down - interaktív feltáró, áttekintő
módszerek
-
Generalized Cluster Analisis -
klaszteranalízis
-
General/CHAID Classification/Regression
Trees - osztályozás és regresszió, döntési fák
-
Boosted Trees, Random Forest -
szavazással összekapcsolt több fás modellek
-
Neural Networks, Intelligent
Problem Solver, Code Generator - neuronhálós
modellek
-
Association Rules -
asszociációs szabályok feltérképezése
-
Generalized Additive Models,
MARSplines, Machine Learning - további speciális
modellek
-
Exponential Smoothing, ARIMA
Models and Forecasting - idősor elemző modellek
-
Goodness of Fit, Lift/Gain
Charts - több modell jóságának összevetése
-
Rapid Deployment - új adatok
vizsgálata a modell alkalmazásával
Vissza a lap elejére
Statistica Sequence, Association and Link Analysis,
SAL
Marketing adatok vizsgálatára, vásárlói szokások
speciális elemzésére szolgáló eszközök gyűjteménye.
Az eddig ismert leggyorsabb, skálázható algoritmusok
felhasználásával egyszerre végzi el a szekvenciális
és nem szekvenciális asszociációs szabályok
keresését. A program a megfelelő szabályrendszer
kidolgozására, modell építésére és alkalmazására,
becslésre, előrejelzésre egyaránt használható.
Főbb jellemzői:
-
Felhasználóbarát kezelőfelület
-
Folytonos és kategorikus
változók, egyszeres és többszörös választás
típusú adatok kezelése
-
Új, hatékony szabálykereső
algoritmus (a közismert a-priori helyett
Tree-Building)
-
Hierarchikus Single-Linkage
klaszteranalízis
-
Extrém méretű adatbázisok gyors
feldolgozása, többszálú végrehajtás
-
Szimultán szabálykeresés több
dimenzióban
-
Az alkalmazás alapjául szolgáló Statistica a hatékony eszközök gazdag
választékával segít a kapott eredmények további
gyors és mélyreható vizsgálatában
Vissza a lap elejére
Statistica Weight of Evidence
Bizonyítéksúly elemzés. A bizonyítéksúly elemzéssel felmérhető a prediktor változók egyes értékeinek hatása a bináris függő változóra. Az elemzés segíthet a változók közti komplex összefüggések leírásában, vagy egyszerűen a trendek felismerésében.
Az eredmény olyan kódolási szabályok sora, melyek alapján a numerikus és kategorikus változók is egyszerűsíthetők, kategóriáik összevonhatók. Az eljárás alkalmazása hatékonyabb modellépítéshez és könnyebben értelmezhető eredményekhez vezet.
További részletek 
Vissza a lap elejére Statistica
Code Deployment
A Statistica Data Miner analitikai moduljai a kialakított prediktív modellekhez PMML kódot generálnak.
Ez a modul számos további kódolási lehetőséget kínál, ami megkönnyíti a modellek felhasználását.
A választható nyelvek: C, C++, C#, Java, PMML, SAS, SQL Stored Procedure (C#), SQL User Defined Function (C#), Statistica Visual Basic
A programkód lehetővé teszi az eredmények használatát prediktív elemzéshez más alkalmazásban, adatbázisban, külső eszközökben, ezzel utat nyit az elosztott adatfeldolgozás, az adatbázisba, felhőbe, intelligens eszközökbe kihelyezett (Edge, IoT) feldolgozás felé.
Vissza a lap elejére
Statistica
Process Optimization
Ez
a komponens
lehetővé teszi az összetettebb gyártási folyamatok adatainak
behatóbb elemzését, követését, a hibák legkorábbi
felismerését, a folyamat optimalizálását.
A Statistica Process
Optimization bármely folyamatra alkalmazható
(általában nagy adatmennyiségre), bonyolult
szervezeteknél, szolgáltatóknál, gyártóknál,
folyamatos és szakaszos (batch) termelő
folyamatoknál egyaránt.
A szoftvert a
felhasználó egyénileg alakíthatja saját
rendszeréhez, vagy a StatSoft mérnökei igazítják az adott feladathoz.
-
Egy egységes rendszeren belül
az összes minőségellenőrző kártya,
folyamatképesség-elemző és kísérlettervezési
eljárás, Hat Szigma
eljárás és kártya együtt használható a
legmodernebb adatbányászati eszközök széles
választékával
-
A program
hozzákapcsolható valós idejű adatsorokhoz, és a
felügyelő folyamat automatikusan figyelembe vesz
minden újonnan keletkezett adatot (minta,
megfigyelés stb.)
-
A programmal kezelhető adatok
száma gyakorlatilag nem korlátozott
-
Külső adatbázisok
mintavételezhetők meghatározott időközönként
-
Csoportkártya készítés,
prediktív elemzések, kártyák
-
Hibaeredet vizsgálat,
válasz-optimalizálás
Vissza a lap elejére
Statistica Text Miner
Alkalmazásával az előzetes rendszerezés nélküli,
nyers szövegek értékes, jól hasznosítható
információforrássá alakíthatók. (Pl. cégek
honlapjainak, tematikus hírcsoportok anyagának
rendszerezése; nyílt, internetes kérdőívek
válaszainak elemzése vagy vitás ügyek teljes
háttéranyagának nyilvántartása.)
-
Dokumentum formátumok: *.txt (text),
*.pdf (Adobe), *.ps (PostScript), *.html, *.xml,
*.doc, *.rtf ...
-
Megadható kizárási szabályok és
listák a gyakran előforduló, de nem
jelentéshordozó szavakra (pl. "to", "the")
-
Az előkészített dokumentum
indexelhető: feljegyzésre kerül minden egyes szó
előfordulása minden dokumentumban
-
A leggyakrabban használt,
jellemző szavak kiválasztása
-
Klaszterező eljárások a hasonló
dokumentumok klasztereinek azonosításához
-
Előrejelző adatbányászati
eljárások a számszerű szövegjellemzők és más
jellemzők (például orvosi diagnózis)
összerendeléséhez
Vissza a lap elejére
Statistica Concurrent Networking (Opció)
A Statistica csomagok gépenkénti licencelése helyett választható a konkurens hálózati kiépítés. Ez a licenc a felhasználó hálózatába kötött gépeken korlátlan számú telepítést tesz lehetővé. A szerződésben megadott licenc szám (2 vagy több) a programot egyszerre használók számát korlátozza. A működés feltétele a felhasználók által folyamatosan elérhető szerver, melyre a licenc szerver telepíthető.
Vissza a lap elejére
Statistica Scorecard (Kiegészítő modul)
Scorecard modellek kialakítása, fejlesztése, ellenőrzése szolgáló eszközkészlet. Az eredmények a Rules builder modul alkalmazásával szabálysorként, PMML, XML formátumban is megjelennek.
Fő funkciói:
-
Adatelőkészítés
- Feature selection, Változó kiválasztás – A legfontosabb változók kiemelése
- Interactions+Rules – A kockázattal összefüggő változó-kombinációk felismerése
- Attribute Building – Változók transzformálása, ideális kategóriaszám
-
Modellezés
- Scorecard preparation – Scoring modell összeállítása, skálázása, dokumentálása
- Survival – A törlesztés megszakadásának idejét is tartalmazó és becslő modell építése
- Reject inference – Az elutasítottak adatainak szimulálása
Fejlesztés, hangolás
- Model evaluation – Modellek összevetése (IV, KS, Gini, Divergence, HL, ROC, Lift/Gain...)
- Cut-off – Elfogadási határok finomhangolása ROC görbe és szimulált profit alapján
- Score cases – Új esetek vizsgálata kiválasztott scoring modell alapján, dokumentálás
- Callibration – Prediktált és tapasztalt Probability of Default összevetése
Követés
- Population stability – Populáció hasonlósági/torzulási teszt
Modell alkalmazás
- Scoring – Kiértékelés, a modell alkalmazása
További részletek 
Vissza a lap elejére |