30.12.2014
Posílení kapacity a vlastností
VíceNamed Entity Recognition (nER)
Náš software dokáže identifikovat jména osob, firem, organizací, měst, datumy, časy, sumy, měny a další typy entit v textech. Využívá sofistikované statistiké algoritmy, strojové učení a technologii zpracování přirozeného jazyka. Umožní vám analyzovat vaše data a extrahovat z nich sémantické vazby. Detekce entit je dostupná jako služba skrze API, nebo může být provozována nezávisle, na vlastním hardware zákazníka.
Množství a typy entit, které dokážeme detekovat jsou v podstatě neomezené. Pro ilustraci jsme vybrali několik možností:
Jméno, Příjmení, Datum narození, Název firmy, IČO, DIČ, Adresa, Telefon, Emailová adresa, Pracovní pozice, Státní instituce, Úřad, Číslo smlouvy, Číslo účtu, Banka, Citace zákona, vyhlášky, Citace soudního rozhodnutí, Soud, Soudce, Advokát
Technologie detekce entit je založena na strojovém učení a statistických modelech. Pro jejich vytvoření jsou potřebná trénovací data. Jsou to vzorky textů, ve kterých jsou již dopředu vyznačeny požadované entity. Data slouží algoritmům strojového učení jako učebnice. Na základě nich se spočítají statistické modely, které pak mohou být aplikovány na nové texty...
V Kamadu Ateliéru máme zkušenosti nejen se strojovým učením ale také s přípravou trénovacích dat. Bude nám potěšením vytvořit pro vás detektory entit šité na míru vašim potřebám a datům.
Technologie našeho ateliéru pro detekci entit je jazykově nezávislá a může být aplikována na libovolný jazyk. Podobně, jako při přidávaní nového druhu detekovaných entit, nový jazyk je taky podmíněn existencí trénovacích dat v novém jazyce.
Řešení detekce entit (nER) můžeme implementovat ve spolupráci s vašim IT oddělením, dodat jako software vaší společnosti, nebo provozovat jako službu na našich serverech. Zaručujeme, že se vaše citlivá data nedostanou do nepovolaných rukou.