Momentan können Textdaten auf Englisch, Deutsch, Französisch, Spanisch und Niederländisch bereinigt werden. Wir sind aber ständig dabei, die Fähigkeiten der KI zu erweitern und dabei auch offen für Ihre Anfragen.
Der Sanity-Check erkennt zufällige Buchstaben oder Zahlen, Nonsenstexte und nicht relevante Aussagen wie „kein Kommentar“ oder sogar Beleidigungen. Was alles aus Ihren Daten entfernt werden soll, bestimmen Sie vorab.
Selbstverständlich. Nach dem Data Cleaning bekommen Sie ein Protokoll über alle Bearbeitungen, aufgelistet nach Kategorie.
Unsere Rechtschreibkorrektur funktioniert konservativ: Stark abweichende Schreibweisen und damit oft absichtlich anders geschriebene Worte werden nicht berücksichtigt. Außerdem werden Begriffe, die nicht im Lexikon gefunden wurden, auf geschützte Namen hin überprüft. Das Bewahren von Information wird also in jedem Fall der perfekten Schreibweise vorgezogen.