Transcript: Natural Language Processing mit spaCy

· Back to episode

Full episode transcript. Timestamps refer to the audio playback.

Dominik

Hallo liebe Hörerinnen und Hörer, willkommen im Paisen-Podcast, heute in einer Jubiläumsepisode und zwar Episode Nummer 30.

Dominik

Natürlich sind wir wieder mit dem Jochen da und ich bin der Dominik.

Dominik

Hallo Dominik.

Dominik

Und heute haben wir auch einen besonderen Gast und das ist die Ines.

Dominik

Ja, hallo Ines.

Dominik

Ja, wollen wir die Ines mal vorstellen, Jochen?

Jochen

Ja, normalerweise, genau, sagen wir Leuten immer, sie sollen sich selber vorstellen, aber ja, vielleicht ist es ja auch gar nicht so schlecht, wenn wir das machen.

Jochen

Ich habe irgendwo gelesen, dass es besser ankommt, wenn man von jemand anders vorgestellt wird.

Jochen

Aber das kommt wahrscheinlich darauf an, von wem man vorgestellt wird. Das tut mir jetzt sehr leid, dass ich das will.

Dominik

Ines ist Explosion, also wer ist Ines?

Jochen

Genau, also wir kamen drauf, weil ich von einem Hörer eine Mail bekommen habe, der sich dafür interessierte, irgendwie ein bisschen mehr über Machine Learning, Natural Language Processing, beziehungsweise halt Spacey zu hören.

Jochen

Und da dachte ich so, oh ja,

Jochen

das stimmt, das wollte

Jochen

ich doch auch selber schon immer mal gerne

Jochen

machen und habe dann halt irgendeine Mail

Jochen

an Ines geschrieben. Und Ines, du hast was mit

Jochen

Spacey zu tun? Und genau,

Jochen

ja.

Jochen

Ines Nick.

Jochen

Wir bei Explosion,

Jochen

wir entwickeln Spacey,

Ines

eine Open-Source-Bibliothek für

Ines

Natural Language Processing in

Ines

Python. Und daran arbeiten

Ines

wir, daran arbeite ich seit

Ines

ein paar Jahren und

Ines

Und ja, damit verbringe ich auch einen Großteil meiner Zeit und wir entwickeln auch andere Produkte und Tools hauptsächlich für Softwareentwickler, die mit Machine Learning und vor allem auch mit NLP arbeiten.

Ines

Also quasi, ja, wir entwickeln Software für Softwareentwickler, um quasi den Alltag ein bisschen schöner und produktiver zu gestalten.

Dominik

Das hört sich spannend an. Ich würde vielleicht vorstellen, dass wir so ein bisschen mit einer Einleitung anfangen für Menschen, die uns noch nicht so folgen können, weil die vielleicht im Thema noch nicht ganz so tief drin sind. Vielleicht nochmal so ganz kurz die Begrifflichkeiten klären. Was ist denn jetzt überhaupt so das NLP und was macht man damit und was für Features würde man denn sowas wie Spacey machen wollen und sowas vielleicht?

Ines

Ja, also grundsätzlich die Idee ist, wir als Menschen produzieren unglaublich viel Text und wir produzieren Text viel, viel schneller, als dass Computer schneller und effizienter werden. Das Internet ist voll mit Text, alles ist Text und wenn wir viel Text haben, kommen wir irgendwann an einen Punkt, wo wir einfach ein bisschen mehr über diesen Text herausfinden möchten.

Ines

Zum Beispiel, ja, und auch weiter, was ein bisschen über Stichwortsuche oder reguläre Ausdrücke hinausgeht.

Ines

Also du möchtest zum Beispiel wissen, wer macht was, wer ist das Subjekt, wer ist das Objekt, was für Personen kommen vor, was für Firmen, was für Konzepte, worum geht's hier, worum geht's hier nicht und so weiter.

Dominik

Also ich kann den Kontext in einem Text erfassen, ist das richtig?

Ines

Genau, also du kannst natürlich in dem Text bestimmte Wörter suchen, aber irgendwann möchtest du ja wissen, okay, ich bekomme hier täglich ein paar Millionen E-Mails.

Ines

Worum geht es in den E-Mails? Welche E-Mails sind wichtig? Welche E-Mails sind nicht wichtig zum Beispiel?

Ines

Oder du hast Nachrichten, du möchtest gucken, was passiert in der Welt? Geht es hier um Apple, die Firma? Geht es hier um Apfel? Geht es hier um diese Thematik und so weiter?

Ines

Ist das Spam? Ist das nicht Spam?

Ines

Und das sind das eben entsprechende Dinge,

Ines

die natürlich abhängen, einmal vom Kontext,

Ines

die auch gar nicht unbedingt immer ganz einfach zu erfassen sind,

Ines

denn Sprache ist ja relativ komplex, Sprache ist sehr zweideutig.

Ines

Und oft sind das auch Dinge, die viel mehr zu tun haben

Ines

mit dem ganzen, mit dem größeren Kontext, die Welt, die Sprache.

Ines

Wie funktioniert Englisch? Wie funktioniert Deutsch?

Ines

Was sagt man so normal? Und was bedeutet das?

Ines

Hat das viel mit Linguistik zu tun?

Ines

Genau, also oft, oft, genau, Computerlinguistik ist auf jeden Fall auch ein Teil vom Bereich NLP, definitiv.

Ines

Ja, und es ist quasi eine Kombination.

Ines

Und heutzutage, was halt heutzutage funktioniert, was vielleicht früher nicht funktioniert hat oder nicht so gut ist,

Ines

dass wir tatsächlich mittlerweile relativ gut einem Computer beibringen können,

Ines

mehr oder weniger zu generalisieren

Ines

und quasi entsprechende

Ines

Vorhersagen zu treffen

Ines

anhand von Beispielen,

Ines

die wir ihm zeigen.

Ines

Und je nach Anwendungsbereich

Ines

klappt das mittlerweile sehr gut. Das heißt,

Ines

wir sind an einem Punkt, wo man auch wirklich

Ines

interessante Dinge damit bauen kann

Ines

und wo auch tatsächlich diese

Ines

Technologie

Ines

auch wirklich zum Einsatz kommt

Ines

in verschiedenen

Ines

Anwendungsbereichen, Firmen,

Ines

Alles Mögliche.

Ines

Ja, ja.

Ines

Früher, also ich hab da

Jochen

auch relativ viel schon, was Textkategorisierungen

Jochen

angeht und so

Jochen

gemacht und zu der Zeit, das ist halt

Jochen

auch schon lange her, aber

Jochen

da waren halt so lineare Modelle das Mittel der Wahl

Jochen

irgendwie, ne? Das war so.

Jochen

Lustigerweise, selbst mittlerweile

Ines

immer noch, es gibt viele Problematiken,

Ines

wo wir nach wie vor Leuten empfehlen

Ines

würden, hey, so eine super

Ines

Oldschool-Methode, linear,

Ines

klappt immer noch besser.

Ines

schneller kannst du auch teilweise

Ines

heutzutage, selbst mit den hottesten

Ines

Modellen teilweise

Ines

nicht überbieten.

Ines

Aber es gibt natürlich andere Bereiche,

Ines

wo wir sagen, okay, gut,

Ines

da braucht man einfach ein bisschen mehr.

Ines

Und ja.

Ines

Ja, genau.

Ines

Also ich meine, da hat sich natürlich,

Jochen

also so ein lineares Modell ist natürlich relativ einfach

Jochen

und inzwischen

Jochen

gibt es ja da irgendwie so,

Jochen

was halt Neuronalen Netze angeht,

Jochen

Deep Learning, irgendwie hat sich ja einiges getan,

Jochen

so im letzten Jahrzehnt so ein bisschen.

Jochen

Und ja, das ist natürlich auch schön,

Jochen

dass man da jetzt irgendwie in dem Bereich

Jochen

nochmal deutlich mehr rausholen kann.

Jochen

Und was ich daran ja auch total faszinierend finde,

Jochen

das ist jetzt auch eine relativ aktuelle Entwicklung

Jochen

mit diesen ganzen Transformer-Geschichten,

Jochen

dass man da tatsächlich irgendwie aus, ja,

Jochen

quasi Text oder ungelabelten

Jochen

Daten halt irgendwie

Jochen

was lernen kann und dann

Jochen

weniger gelabelte Daten braucht, weil

Jochen

gelabelte Daten sind natürlich immer relativ schwer zu bekommen.

Jochen

Ja, und ich glaube,

Ines

es löst

Ines

auch ein viel tiefer liegendes Problem,

Ines

was wir halt schon immer hatten, und zwar,

Ines

dass Sprache ja wirklich

Ines

auch nur im Kontext der Welt

Ines

und im Kontext

Ines

der Linguistik existiert.

Ines

Das heißt, wenn du jetzt ein Modell trainierst und

Ines

selbst wenn du dem nur beibringen möchtest, ist diese

Ines

E-Mail, Spam oder nicht.

Ines

Das Modell muss zusätzlich zu

Ines

dem tatsächlichen

Ines

Problem und den

Ines

entsprechenden Wörtern, die wahrscheinlich

Ines

meistens darauf hindeuten, ob es Spam ist oder

Ines

nicht, auch noch so viele andere Dinge

Ines

lernen. Zum Beispiel schon allein,

Ines

okay, wie funktioniert die englische

Ines

Sprache? Wie werden da die

Ines

Wörter meistens angeordnet? Oder auch einfach,

Ines

wie funktioniert

Ines

die Welt? Was sind Wörter, die

Ines

im Kontext der Welt

Ines

benutzt werden? Und wie passt das alles

Ines

zusammen. Und das ist

Ines

unglaublich viel Wissen, was

Ines

man eben auch einem Modell quasi immer

Ines

wieder beibringen muss, damit man überhaupt

Ines

das machen kann, was sie wollen.

Dominik

Ja, genau.

Ines

Und du wirkst wirklich immer quasi

Ines

immer von vorne anfangen. Oder so war

Ines

es in der Vergangenheit. Und jetzt

Ines

Transfer Learning

Ines

nennt man das auch.

Ines

Eine Sache, die wir jetzt halt

Ines

können und die jetzt tatsächlich funktioniert, ist, dass wir

Ines

quasi

Ines

wissen, dass wir aus anderen

Ines

Prozessen gewonnen haben, quasi

Ines

transferieren können auf das neue Problem.

Ines

Also wir können quasi was vortrainieren,

Ines

was unserem Modell

Ines

quasi ermöglicht, schon ein bisschen mehr

Ines

zu wissen über die Sprache

Ines

und die generelle Welt und

Ines

die generellen Wörter und so weiter. Also wir

Ines

können quasi sagen, hier ist ganz viel

Ines

roher Text, guck dir

Ines

das an und wie es

Ines

zum Beispiel funktioniert ist, die Aufgabe

Ines

ist, hier sind

Ines

ein paar Wörter und wir lassen jetzt ein Wort

Ines

weg und dann lassen wir

Ines

unser Modell vorhersagen,

Ines

was das Wort sein könnte. Und das machen wir

Ines

relativ lange, bis

Ines

es hoffentlich eine ganz gute Gewichtung

Ines

aufgebaut hat und das nächste Wort vorhersagen kann.

Ines

Und es hat sich herausgestellt, dass diese

Ines

Aufgabe sich sehr gut generalisieren

Ines

lässt für andere Sachen. Das heißt,

Ines

die Gewichtungen, die wir da aufbauen,

Ines

die haben unglaublich viel Informationen

Ines

inkludiert quasi über die Sprache.

Ines

Was ja auch irgendwie Sinn macht, wenn du überlegst, okay,

Ines

was muss man

Ines

wissen oder lernen, um das nächste

Ines

Wort vorhersagen zu können.

Ines

Und das ist quasi so die Essenz von dem, was jetzt quasi ein bisschen neuer ist und was auch dafür sorgt, dass man eben relativ wenig gelabelte oder spezifische Daten braucht, um auch ein relativ komplexes neues Problem zu lösen, da man eben auf dieses generellere Wissen zurückgreifen kann. Also man kann quasi diese Gewichte vortrainieren. Und das ist die Idee.

Jochen

Ja, ich, genau, letztens gab es auch irgendwie einen Blogpost von Facebook, da Jan LeCun oder, ach, den anderen habe ich jetzt vergessen, keine Ahnung, da nannten sie das irgendwie Self-Supervised Learning, weil es ja im Grunde gar nicht so wirklich unsupervised ist.

Jochen

Man hat ja schon irgendwie, ja, ich meine, die Information, dass in dem Text das Wort gestanden hat und lernt jetzt eben daraus, dass man das als das, was man vorhersagen möchte, betrachtet. Oder eben Transfer Learning, ja, ist halt auch…

Ines

Ja, Terminologie generell im Bereich.

Ines

Was nennt man ein Modell?

Ines

Das, finde ich, ist leider ein bisschen unglücklich.

Ines

Das heutzutage, oder so, Language Model

Ines

wird halt für so viele Dinge benutzt.

Ines

Ja, da wünsche ich mir manchmal,

Ines

dass so ein bisschen die Terminologie ein bisschen klarer wäre,

Ines

weil das auch ein bisschen, glaube ich,

Ines

ja, Verwirrung stiftet.

Ines

Wie würdest du das denn definieren?

Ines

Was ist ein Language Model?

Ines

Das Problem ist halt, okay,

Ines

grundsätzlich ein Modell,

Ines

oder zumindest

Ines

traditionell, man nennt vieles Modell.

Ines

Manche Leute nennen den

Ines

Algorithmus ein Modell. Das ist also

Ines

quasi die Implementation, den

Ines

Code, den du dafür schreibst. Aber dann

Ines

gibt es natürlich auch das Artefakt, dass du

Ines

da trainierst. Also die

Ines

Gewichte, also quasi so eine

Ines

binäre Datei, die dann da rumliegt

Ines

und die du am Ende speicherst.

Ines

Und vielleicht das zusammen

Ines

kann man eigentlich so als Modell bezeichnen.

Ines

Dann, ich glaube, früher

Ines

Language Model haben wir früher auch gerne genannt.

Ines

Modelle, die wir trainiert haben für verschiedene Sprachen.

Ines

Aber das würde jetzt auch heutzutage viel benutzt

Ines

für eben diese Gewichte, die man trainiert,

Ines

auf der Basis von rohem Text.

Ines

Das ist also heute hauptsächlich, was Leute meinen,

Ines

wenn sie Language Model sagen.

Ines

Also okay, wir haben kompletten Text aus der Wikipedia

Ines

im Englischen runtergeladen und diese Embeddings trainiert,

Ines

indem wir das nächste Wort vorhergesagt haben.

Ines

Und die kann man jetzt weiter benutzen.

Ines

Und das ist jetzt, das ist ein Language-Motto.

Ines

Also es gibt da verschiedene,

Ines

es gibt verschiedene Definitionen oder verschiedene,

Ines

ja,

Jochen

Verwendungen. Ja, es wird halt irgendwie in unterschiedlichen Kontexten

Jochen

halt unterschiedlich, unterschiedlich

Jochen

verwendet, ja. Und es ist ja auch was,

Ines

Leute, was nennt man Machine Learning, was nennt man

Ines

KI?

Ines

Oh, AI. Ist auch leider nicht immer so,

Ines

immer, oder AI, genau.

Ines

Ja, genau, da muss ich

Ines

mich auch immer dran gewöhnen, weil ich bin tatsächlich,

Ines

die deutsche Terminologie ist mir

Ines

nicht so nah, weil ich es halt nie,

Ines

Weil ich es halt nie gelernt habe auf Deutsch.

Ines

Also ich bin immer gewohnt, so auf Englisch drüber zu lesen.

Ines

Du bist auch gerade in Australien, ne?

Ines

Ich bin momentan gerade in Australien, ja.

Ines

Ein bisschen Social Distancing von Europa.

Ines

Genau, so weit wie möglich weg.

Ines

Ich glaube, viel weiter geht auch gar nicht.

Ines

Ja, also wie gesagt, ich freue mich drauf, wieder zurückzukommen.

Ines

Aber halt momentan ist, okay, gut, bringt ja auch keinem was,

Ines

wenn ich jetzt in der momentanen Situation da wieder in den Flieger steige.

Ines

Aber ich habe halt auch nie so,

Ines

ich habe zum Beispiel nie jetzt klassisch

Ines

Informatik studiert oder so.

Ines

Das merke ich teilweise im Vergleich,

Ines

dass manche Leute, die halt auf Deutsch programmieren

Ines

gelernt haben, da so

Ines

die deutsche Terminologie drauf haben.

Ines

Und da muss ich mich

Ines

auch erstmal reinlesen. Ich habe für

Ines

Spacey so einen Online-Kurs gemacht, den habe ich auch

Ines

in verschiedenen Sprachen übersetzt. Also ich nicht,

Ines

ich habe ihn auch nur auf Deutsch übersetzt. Mehr Sprachen

Ines

kann ich nicht. Aber andere

Ines

aus der Community haben uns dabei geholfen

Ines

und ich musste mich erstmal sehr reinlesen in

Ines

die deutsche Programmier-Terminologie.

Ines

So sagt man iterieren.

Ines

Also

Ines

Konsens ist Stein bei Ja.

Ines

Ja, ich will das auf Deutsch

Dominik

sagen, das hört sich manchmal komisch an.

Jochen

Ja, es ist sehr

Jochen

eigenartig. Ich komme manchmal jetzt so

Jochen

oder das Problem hatte ich jetzt letztens,

Jochen

dass dann

Jochen

irgendwie, ich weiß nicht,

Jochen

Domain-Driven Design, ob das euch ein

Jochen

Begriff ist, wo man, wenn man jetzt in einer

Jochen

anderen Domäne unterwegs ist, also gar nicht

Jochen

unbedingt jetzt, wenn es ums

Jochen

Programmieren geht, sondern einfach fachlich

Jochen

ist man halt irgendwas unterwegs, wo Leute halt ihre eigene

Jochen

Sprache für

Jochen

entwickelt haben, um sich überhaupt austauschen

Jochen

zu können über das Thema, mit dem sie da zu tun haben.

Jochen

Und da habe ich dann erstmal alles

Jochen

nach Englisch übersetzt, weil ich das so schrecklich

Jochen

fand, weil das geht gar nicht, wenn

Jochen

da irgendwie so deutsche Wörter im Source Code stehen,

Jochen

dann dachte ich so, jetzt muss ich unbedingt übersetzen.

Jochen

Dann habe ich dann weitergelesen, dann hieß es so, naja,

Jochen

nee, am besten immer die Originalbegriffe benutzen,

Jochen

weil ansonsten ist das die totale Verwirrung.

Jochen

Man weiß hinterher überhaupt gar nicht mehr, was was bedeutet.

Jochen

Ja, das ist mir dann auch passiert.

Jochen

Es ist irgendwie nicht so einfach.

Jochen

Mit den unterschiedlichen Sprachen ist blöd.

Dominik

Ja, oder Mischung halt. Gerade im IT-Bereich

Dominik

ist ja voll oft so Denglisch irgendwie dann.

Dominik

Ja, und ich meine, Programmieren

Dominik

an sich, ich meine, Python ist

Ines

Englisch. Und auch so, du merkst

Ines

natürlich, du hast die Wörter, du programmierst

Ines

auf Englisch.

Ines

Oder schon allein, wenn du dir so eine deutsche

Ines

Tastatur anguckst. Die englische

Ines

Programmiersprachen sind meist für

Ines

die amerikanische Tastatur entwickelt worden.

Ines

Deswegen haben wir den Backtick an der

Ines

blödesten Stelle

Ines

und es ist eigentlich der Akzent.

Ines

Oder Backslash.

Ines

Ja, oder andere, oder die ganzen

Ines

Klammern zu tippen. Warum ist das

Ines

so nervig auf unseren

Ines

Tastaturen?

Ines

Ja, weil...

Dominik

Irgendwer wollte unbedingt eine neue eigene Tastatur machen.

Dominik

Ja, es ist anstrengend.

Ines

Ich hab immer mal überlegt, ob ich einfach mal

Ines

sagen soll, okay, ich lerne

Ines

die amerikanische Tastatur, weil es ja wirklich fürs Programmieren

Ines

einfach ist. Also einfach eine Taste zu haben, wo du

Ines

einen Backtick tippen kannst,

Ines

ist

Ines

einfach. Aber ich bin halt, ich hab mich,

Ines

ja, ich krieg das nicht mehr. Ich glaub, ich bin zu alt.

Ines

Ich bin da zu.

Dominik

Ja, musst wahrscheinlich anfangen mit einer anderen.

Jochen

Ja, oder bei mir ist das Problem auch immer, ich hab's dann immer mal überlegt,

Jochen

ob ich dann nicht in meinem nächsten Rechner dann tatsächlich amerikanische

Jochen

Tastatur oder englische Tastatur halt nehme.

Jochen

Und dann dachte ich mir, aber ich hab jetzt noch ein paar andere.

Jochen

Nichts da, die Tastatur.

Jochen

Ja, also wenn man halt wirklich...

Ines

Ich hab auch gerne die Umlaute auf der Tastatur.

Ines

Also es stört mich, wenn ich jetzt nicht in Ö tippen kann oder so.

Dominik

Ja, aber ich sag mal, die Sprache, wir tippen ja schon alles dann auf Englisch raus.

Dominik

Also auch Kommentare und so würde ich jetzt mal schätzen, dass wir alle die auf Englisch schreiben.

Dominik

Das macht ja auch irgendwie Sinn, wenn man irgendwie ein bisschen kollaborativ arbeiten möchte und so.

Dominik

Und ja, es ist halt schon interessant.

Dominik

Also ich glaube, Englisch ist halt, wenn man so ein Natural Language anguckt,

Dominik

mit Sicherheit um Meilen weiter, als das irgendwie Deutsch sein wird.

Dominik

Und Meilen ist wahrscheinlich noch zu wenig.

Dominik

Einfach von der Masse an Sätzen, die so gesagt werden in den jeweiligen Sprachen und was man damit halt an Datenbasis irgendwie anfangen kann.

Ines

Aber auch einfach die Forschung, also generell die Forschung findet auf Englisch statt und natürlich, es gibt unglaublich viel interessante Arbeit auch, was NLP angeht, in anderen Sprachen und auch die Forschung, aber grundsätzlich muss man sagen, rein alle Sprachen, die Englisch ähneln, mit denen können wir momentan auch im Bereich Machine Learning am besten umgehen, weil da einfach die meiste Forschung stattgefunden hat.

Dominik

Okay, interessant. Welche Sprachen ähneln Englisch?

Ines

Also natürlich so die romanischen Sprachen schon, also alles, also es ist halt so ein Spektrum, aber Chinesisch zum Beispiel eher nicht.

Ines

Also es ist eher, ich würde sagen, eher die Sprachen, die Englisch am unähnlichsten sind, sind durchaus auch weniger erforscht oder die Techniken, die veröffentlicht werden oder die geforscht werden und die Strategien für Machine Learning und so weiter, die sind halt schon meist optimiert für Englisch.

Ines

Und da ist natürlich auch die Motivation da für den Forscher zu sagen, okay, gut, du möchtest ja auch, das kann man ja auch den einzelnen Leuten da nicht ankreiden. Also du möchtest natürlich, wenn du auf einem Gebiet forschst, du möchtest deine Experimente vergleichen können mit anderer Arbeit, du möchtest sagen, hey, hier, cool, ich habe tatsächlich was entwickelt und was gemacht hier, das irgendwie besser ist als das, was vorher da war.

Ines

Und ja, die wichtige Arbeit funktioniert mit englischem Corpora.

Ines

Und das heißt, natürlich ist da eine Motivation da,

Ines

auch mit der englischen Sprache zu arbeiten.

Ines

Und natürlich ist einfach mehr und mehr Daten da.

Jochen

Ja, auch einfach viel mehr Trainingsdaten.

Ines

Aber man muss auch sagen, okay, momentan,

Ines

wir sind am Punkt, wo man gar nicht mehr unbedingt so viele Daten braucht.

Ines

Man kann Daten selber erstellen, das ist ja auch ein Bereich, in dem wir arbeiten, also unser kommerzielles Produkt, wodurch wir auch Geld verdienen, weil wir machen ja unglaublich viel Open Source, was wir verschenken quasi, ist Prodigy, das ist ein Annotationstool, speziell entwickelt für Entwickler und Machine Learning.

Ines

Also die Idee ist, okay, oft, wenn du halt ein spezielles Problem löst, ist es oft nicht damit getan, dir einfach irgendein Modell aus dem Internet runterzuladen, das irgendjemand anders mal trainiert hat und das vielleicht ein bisschen ähnlich ist zu dem, was du machen möchtest.

Ines

Und da wir auch heute an einem Punkt sind, wo wir sagen, du brauchst gar nicht mehr Big Data Milliarden an Beispielen, auch ein paar Hundert, paar Tausend, damit kannst du echt, also wenn du es gut machst und wenn das gut durchdacht ist und du dir Gedanken machst, okay, wie strukturiere ich das Problem, kannst du damit echt super Resultate mittlerweile erzielen.

Ines

Das heißt, es ist auch komplett machbar, dass du sagst, hey, ich setze mich einfach hin und verbringe eine Stunde, gucke mir meine Daten wirklich an, überlege mir, wie label ich die. Und wenn das Tool effizient ist und du damit gut arbeiten kannst, kannst selbst du als einzelner Mensch innerhalb von einer Stunde ein Datenset erstellen, mit dem du wirklich was auch produktiv machen kannst.

Dominik

Vielleicht da nochmal auf die Features könnten wir da nochmal eingehen.

Dominik

Was macht denn Spacey jetzt genau mit einem Datensatz?

Dominik

Also was kannst du damit alles bauen?

Ines

Also Spacey ist eine Bibliothek, mit der du moderne NLP-Systeme bauen kannst.

Ines

Also wir haben verschiedenste Komponenten, die du trainieren kannst.

Ines

Wir haben natürlich auch Pipelines, die man sich runterladen kann,

Ines

die wir vortrainiert haben.

Ines

Und für verschiedenste Tasks oder verschiedenste Probleme kannst du halt deinen Text reinfüttern

Ines

und du bekommst am Ende die Annotationen, die das Modell extrahiert hat, am Ende raus.

Ines

Also zum Beispiel fängt an bei Wortarten.

Ines

Du fütterst einen Text rein und das Modell kann vorher sagen, ist das ein Verb, ist das ein Nomen und so weiter, je nach Sprache.

Ines

Dann gibt es natürlich auch die Beziehungen der Wörter zueinander.

Ines

Ist das das Subjekt? Ist das das Objekt?

Ines

Das ist auch was, was man vorhersagen kann.

Ines

Und Spacey hat halt auch entsprechende Datenstrukturen,

Ines

die das halt auch abbilden können.

Ines

Denn du möchtest ja idealerweise nicht alles hier in der Liste,

Ines

hier im Dictionary haben,

Ines

sondern du möchtest wirklich alles effizient gespeichert haben

Ines

an einem Punkt.

Ines

Und du möchtest jedes Wort am Ende

Ines

zu jedem anderen Wort wieder zurückführen können.

Ines

Also du möchtest wirklich, okay, hier habe ich ein Wort im Kontext.

Ines

Wie hängt das Wort mit dem Wort zusammen?

Ines

wie hängt das mit dem Satz zusammen und da hat Spacey halt auch die Datenstrukturen, die dich damit effizient arbeiten lassen.

Ines

Named Entity Recognition, das heißt, man kann auch basierend auf einem Text voraussagen,

Ines

welche Wörter sind zum Beispiel ein Personenname, ein Städtename, Produktname, Firmenname und so weiter.

Ines

Und das ist natürlich vor allem spannend, wenn man das halt auf seine ganz spezielle Problematik zuschneidet.

Ines

Also wenn man spezielle Begriffe in seinem Bereich hat und dann kannst du wirklich ein Modell trainieren,

Ines

dass das entsprechend dir vorhersagen kann.

Ines

Und dann hast du halt ...

Dominik

Ja, also alle Fachbegriffe für die Domäne irgendwie, ne?

Dominik

Genau, und dann kannst du auch sagen,

Ines

okay, der Personenname, ist das jetzt das Subjekt oder das Objekt?

Ines

Und so weiter.

Ines

Oder andere Komponenten, wo wir halt gerade dran arbeiten

Ines

oder die man halt auch bauen kann.

Ines

Du kannst sagen, wenn du jetzt ein Pronomen hast,

Ines

so er bezieht sich das, auf wen bezieht sich das?

Ines

Also der Mann kommt nach Hause, er zieht sich die Schuhe aus.

Ines

Kannst du das Er zurück auf den Mann beziehen?

Ines

Das ist auch in vielen Kontexten sehr wichtig.

Ines

Denn das ist was, wenn wir das lesen, uns ist das relativ klar.

Ines

Wenn du das maschinell machst, ist es deutlich trickier

Ines

und auch nicht immer so eindeutig, wie wir das gerne hätten in der Sprache.

Ines

Ja, Text-Klassifizierung hast du ja schon mal angesprochen vorher.

Ines

Du kannst natürlich auch Labels für den ganzen Text vorher sagen.

Ines

Geht's hier um Sport? Geht's hier um Politik?

Ines

Geht's hier um Spam?

Ines

Das ist was, was du machen kannst.

Ines

Und Spacey lässt dich halt diese Komponenten zu einer Pipeline zusammenbauen.

Ines

Und natürlich zwischendurch, es kann auch sein, dass du sagst,

Ines

hey, ich möchte einen Baustein, der soll einfach nur richtig oldschool,

Ines

ein paar reguläre Ausdrücke sein.

Ines

Denn in der Praxis ist das nach wie vor, es macht Sinn, du trainierst ein System, richtig fancy, Transformers, Named Entity Recognition, geil, sagt Firmennamen voraus, funktioniert super und dann, weiß nicht, zeigst es deinem Chef, der gibt irgendwas ein mit deinem Firmennamen drin und das Ding erkennt den eigenen Firmennamen nicht, weil der irgendwie komisch ist und überhaupt nichts Ähnliches in den Trainingsdaten war.

Ines

Jetzt können sie sagen, oh, da mache ich jetzt nochmal neue Trainingsdaten, tune meine Hyperparameters und verbringe dann nochmal ein paar Wochen dran und am Ende kriegt der unseren Firmennamen hin, aber kann irgendwelche anderen Sachen nicht mehr. Oder du sagst, ja geil, haue ich jetzt einfach einen regulären Ausdruck drauf und dann kriegt der unseren Firmennamen immer richtig hin. Und in der Praxis, so löst man viele dieser Probleme.

Ines

Und so sehen auch praktische Systeme aus. Du hast vielleicht einen super heißen, modernen Baustein, der halt die neuesten Transformer-Modelle verwendet und dann hast du vielleicht einen Text-Classifier, der noch Oldschool, lineares Modell, weil es halt einfach gut funktioniert.

Ines

Dann hast du noch ein paar Regeln obendrauf und am Ende hast du halt eine Repräsentation von einem Text, wo alle diese Informationen drin ist, die du dann verwenden kannst, um was auch immer dein eigentliches Ziel ist, zu erreichen. Denn das ist ja auch nochmal ein Problem. Oft die tatsächlichen Ziele, die man hat und die Probleme, die man lösen möchte, die sind ja nicht immer eins zu eins übertragbar in ein Machine Learning Modell, das man trainiert.

Ines

Das ist auch sowas, okay, so stellen sich das manche Leute manchmal vor, unsere Firma möchte, dass wir das und das und das auslesen und das am Ende so und so in die Datenbank eingeben, kann man versuchen wirklich von A nach B komplett ein System vorhersagen zu lassen, ist aber oft in der Praxis nicht sonderlich nützlich und auch nicht, oft muss man sich hinsetzen, okay, wie kann man das Problem runterbrechen in kleinere Bausteine,

Ines

Die man auch tatsächlich effektiv mit den technischen Möglichkeiten, die wir momentan haben, lösen kann.

Jochen

Ja, es ist auch immer wieder, ich meine, ich finde das ja tatsächlich erstaunlich, dass sich im Grunde alle Probleme letztendlich dann doch, auch vielleicht manchmal in mehreren Stellen,

Jochen

Schritten, aber auf eben sowas Simples

Jochen

wie, ja, binäre Klassifikationen

Jochen

quasi runterbrechen lassen, weil

Jochen

das ist,

Jochen

ja, von binärer Klassifikation zu

Jochen

Multilabel, also dass man halt mehrere Labels

Jochen

jetzt für den Text vorher sagt oder so, ist eigentlich quasi auch das

Jochen

Gleiche. Und, ja,

Jochen

dann gibt's halt noch Regression und dann gibt's

Jochen

halt noch Clustering und dann war's das im Grunde schon.

Jochen

Aber man kann damit halt eine Menge machen.

Jochen

Dann dachte ich, so, hm, damit soll man wirklich alles machen

Jochen

können. Aber ja, es geht schon, aber

Jochen

man muss sich halt dann doch ein bisschen,

Jochen

ja, manchmal... Ich glaube, es geht halt

Ines

auch so ein bisschen ums Mindset, aber das ist ja auch

Ines

beim Programmieren generell

Ines

nicht anders. Also wenn du jetzt sagst, okay, ich habe

Ines

hier ein Problem, das möchte ich lösen mit

Ines

Python, dann musst du dir auch überlegen, okay, was habe ich hier zur Verfügung?

Ines

Was sind so diese Abstraktionen?

Ines

Wie strukturiere ich

Ines

das? Was macht Sinn?

Ines

Was macht keinen Sinn?

Ines

Und das ist quasi der Job,

Ines

den du dann als Softwareentwickler löst.

Ines

Und so ähnlich ist es auch

Ines

im Bereich Machine Learning. Ist auch quasi

Ines

eine Art zu programmieren.

Ines

Ist halt nur ein bisschen anders

Ines

und man hat halt noch diese Daten als die

Ines

Komponente. Im so klassischeren

Ines

Programmieren hast du halt

Ines

im Programm, da geht was rein, kommt immer was

Ines

raus. Hier hast du Code plus Daten.

Ines

Ja, beziehungsweise

Ines

das, was man programmiert,

Ines

ist nicht so sehr

Jochen

ein Algorithmus, aber man legt eher die Daten

Jochen

für ein Modell fest, das dann irgendwie

Jochen

tatsächlich dann

Jochen

irgendwie was macht. Das fand ich auch interessant,

Jochen

das gab es, glaube ich, 2018 gab es

Jochen

einen Vortrag von André

Jochen

Capati, ich weiß gar nicht, wie das auch

Jochen

gesprochen wird. Software 2.0

Jochen

oder Software 2.0. Genau, also das ist auch

Jochen

eine sehr ähnliche Idee.

Jochen

Genau, da sagt er auch, ja, also

Jochen

früher haben wir halt sozusagen

Jochen

eine, also wir haben

Jochen

ein Problem und dann haben wir

Jochen

einen Lösungsraum für dieses Problem und

Jochen

wenn wir jetzt das explizit programmieren, dann

Jochen

nehmen wir uns einen ganz winzigen

Jochen

Punkt aus diesem Lösungsraum raus

Jochen

und definieren den halt exakt.

Jochen

Aber tatsächlich kann man ja auch vielleicht einfach eben

Jochen

per Daten so eine Region

Jochen

aus dem Lösungsraum rauszeigen und

Jochen

dann halt ein Optimierungsverfahren

Jochen

verwenden, um tatsächlich die

Jochen

Lösung zu finden, also quasi

Jochen

per Machine Learning

Jochen

ein Modell trainieren, das dann halt sozusagen

Jochen

die Lösung

Jochen

modelliert und

Jochen

dann verändert sich der

Jochen

Job als Programmierer halt so ein bisschen

Jochen

und ja, das fand ich

Jochen

auch sehr interessant. Ich dachte so, ja, das ist natürlich, das hebt

Jochen

es dann wieder auf eine etwas abstraktere Ebene.

Jochen

Dann werden natürlich die Tools, die man dafür braucht,

Jochen

halt extrem wichtig und sehr

Jochen

interessant. Genau, und auch die

Ines

Daten einen ganz anderen Stellenwert bekommen. Und das ist halt

Ines

auch was, was meiner Meinung nach nach wie vor nicht genug

Ines

Aufmerksamkeit bekommt.

Ines

Also auch so als Analogie jetzt,

Ines

wenn du programmierst, klassisch

Ines

schreibst du deinen Code,

Ines

dann hast du einen Compiler, da geht dein

Ines

Code rein und am Ende kommt ein Programm

Ines

raus. Und jetzt

Ines

mit Machine Learning hast du

Ines

deine Daten, du hast einen Algorithmus

Ines

und am Ende trainierst du dein Modell und dein Modell

Ines

kommt raus. Und wenn du jetzt

Ines

feststellst, okay, dein Modell ist nicht sonderlich

Ines

geil. Oder im klassischen Programmieren,

Ines

dein Programm, was am Ende rauskommt

Ines

aus deinem Compiler, macht nicht das, was es

Ines

soll, ist zu langsam, funktioniert nicht,

Ines

hat Bugs. Was machst du?

Ines

Du könntest natürlich hingehen und sagen,

Ines

okay, da gehe ich jetzt erstmal an den

Ines

Compiler ran und schreibe mir meinen eigenen Compiler.

Ines

Machst du aber normalerweise nicht.

Ines

Normalerweise, du gehst in deinen Code rein

Ines

und veränderst deinen Code

Ines

und passt den an und fixt den,

Ines

damit dein Programm am Ende besser wird.

Ines

Ich will damit nicht sagen, es gibt super viel Arbeit,

Ines

die man im Bereich Compiler noch machen kann,

Ines

aber das ist normalerweise so nicht das Erste, was man macht.

Ines

Und analog natürlich, Machine Learning,

Ines

wenn dein Modell nicht das macht, was es soll

Ines

und du damit nicht zufrieden bist,

Ines

kannst du hingehen und deinen Algorithmus tweaken.

Ines

Und natürlich kann sein, dass da ein Bug drin ist,

Ines

der dafür sorgt, dass dein Modell nichts lernt.

Ines

Aber meistens, was du machen solltest, ist, dir die Daten angucken.

Ines

Und du kannst das Schöne am praktischen Machine Learning

Ines

oder quasi praktischen NLP, wenn du es halt wirklich anwendest, auf Probleme ist.

Ines

Dass du quasi selber entscheiden kannst, wie schwierig oder wie einfach du dir quasi das Problem machst.

Ines

Du kannst ja kontrollieren, wie du deine Daten annotierst, wie du die aufbereitest,

Ines

wie du das Problem runterbrichst.

Ines

Und das ist, glaube ich, auch, wie sich zum Beispiel die angewandte Praxis

Ines

so ein bisschen unterscheidet von der reinen Forschung.

Ines

In der Forschung ist das Ziel ein ganz anderes.

Ines

Du hast ein Problem, du hast quasi eine Benchmark, du hast einen Algorithmus, den du entwickelt hast und dann, es macht natürlich Sinn, wir wollen alle unsere Algorithmen am selben Problem vergleichen, denn nur so kannst du sehen, ist das, was ich jetzt hier mache, besser als das, was jemand anders gemacht hat. Macht meine Idee Sinn, funktioniert das?

Ines

Das heißt, da setzt du dich typischerweise nicht hin und änderst das Problem, denn dann hat deine ganze Forschung keinen Sinn mehr. Aber das sind eben ein bisschen die anderen Denkweisen, die man da hat und das ist auch, glaube ich, etwas, was einfach die angewandte Praxis unterscheidet.

Ines

Und auch jetzt, um es wieder zurückzuführen, ein bisschen auf das, was wir so machen, was auch so ein bisschen die Philosophie von Spacey unterscheidet von vielleicht anderen Bibliotheken und auch die Gedanken, die wir uns machen müssen. Unsere Nutzer sind ja Entwickler, die wirklich in der Praxis diese Systeme bauen.

Ines

Und das heißt, wir müssen natürlich Entscheidungen treffen, die das besonders effizient und einfach machen, aber auch die Möglichkeit geben, eben diese Bausteine entsprechend zusammenzusetzen, manche Bausteine wiederzuverwenden und eben eine flexible Möglichkeit zu haben, diese Systeme halt zu bauen und auch zu testen und auch zu sehen, okay, wenn was nicht funktioniert, möchtest du ja gucken, wo ist das Problem?

Ines

Das ist sehr schwer, wenn alles so eine Blackbox ist und du am Ende nicht weißt, was passiert da. Da geht was rein, am Ende kommt was raus und ja, das war's halt.

Jochen

Ja, genau. Und das ist natürlich auch sowas, was man wahrscheinlich im akademischen Bereich nicht so häufig hat, dass man eben auch mit den Annotationstools viel zu tun hat oder auch mit, so was ich auch immer häufig sehe, dass man, dass halt dieses, wie speichert man Daten, wie reagiert man darauf, wenn sich Daten verändern oder so, ist halt ein ganz wichtiger Teil. Dieser ganze Data Engineering Aspekt ist halt auch total wichtig. Und den hat man halt eigentlich gar nicht, wenn man jetzt mit fixen Corpora arbeitet, die immer gleich sind.

Ines

Wie gesagt, das ist ja auch nicht unbedingt was,

Ines

wo sich ein Forscher mit beschäftigen möchte.

Ines

Aber ich glaube, es ist eher was, was man auf der anderen Seite,

Ines

wenn man eben im angewandten Bereich arbeitet,

Ines

sich halt bewusst machen muss,

Ines

okay, es gibt so ein bisschen den Momentan,

Ines

viele Leute sind unglaublich heiß drauf

Ines

und wollen sich halt so, okay, die letzte Forschung direkt rein,

Ines

ins Blut, direkt injizieren, so schnell wie möglich.

Ines

Und in manchen Bereichen geht das.

Ines

und natürlich, wir haben wirklich in den letzten Jahren

Ines

vor allem sehr schnelle Adoptionen gesehen

Ines

von Dingen, die in der Forschung entwickelt wurden

Ines

und auch praktisch

Ines

sehr schnell auch

Ines

wendbar

Ines

waren

Ines

und natürlich, der Kreislauf

Ines

wird schneller und wenn irgendwas Interessantes

Ines

rauskommt,

Ines

dann dauert es auch

Ines

nicht mehr so lange, bis man auch tatsächlich

Ines

was Sinnvolles damit machen kann, aber es ist halt nicht immer so

Ines

und es ist auch nicht immer nur, weil irgendein

Ines

Paper rauskommt, was halt spannend

Ines

klingt, heißt es nicht, dass es unbedingt

Ines

das ist, was

Ines

dein System auf jeden Fall jetzt braucht.

Ines

Und ja.

Ines

Wie gesagt,

Ines

für viele Probleme,

Ines

selbst mit einem oldschool linearen Modell

Ines

kannst du oft

Ines

viel machen. Oder wenn

Ines

dein lineares Modell das überhaupt nicht hinkriegt,

Ines

heißt es auch oft, dass

Ines

vielleicht die Definition

Ines

deines Problems eher das Problem

Ines

ist als

Ines

der genaue Algorithmus.

Ines

Ja, ja, ja, ja.

Ines

Ja.

Ines

Genau.

Ines

Ihr macht ja auch noch

Jochen

im Prodigy

Jochen

dieses Annotationstool.

Jochen

Das ist auch alles quasi so, wie

Jochen

Spacey auch Python, beziehungsweise

Jochen

wahrscheinlich dann im Frontend irgendwie was anderes ist,

Jochen

weiß ich gar nicht.

Ines

Ja, also Frontend natürlich, du brauchst immer ein bisschen JavaScript,

Ines

damit es im Browser läuft und es ist

Ines

so eine relativ leichte React-App,

Ines

Aber ja, Backend ist alles in Python

Ines

und die Philosophie ist auch wirklich,

Ines

okay, es ist ein Entwicklertool, du möchtest damit programmieren.

Ines

Das war uns immer unglaublich wichtig.

Ines

Und ja, wir freuen uns auch,

Ines

das wurde halt super gut angenommen.

Ines

Prodigy ist sehr erfolgreich.

Ines

Und das ist auch was, was wirklich, glaube ich,

Ines

Entwickler anspricht.

Ines

Und das ist auch die Art von Tools,

Ines

die wir entwickeln wollen und natürlich auch die Art von Tools,

Ines

die wir auch gerne benutzen wollen.

Ines

Also ich möchte, wenn ich mit etwas arbeite,

Ines

ich möchte programmieren können.

Ines

wenn ich irgendwas

Ines

möchte, wenn ich

Ines

weiß, wie ich irgendwas in Python machen kann

Ines

und ein Tool gibt mir die Möglichkeit,

Ines

da einfach ein bisschen Code zu schreiben,

Ines

denke ich, cool, super.

Ines

Vor allem, weil ja auch in dem Bereich

Ines

fast alles andere in Python

Ines

läuft.

Ines

Wenn du jetzt

Ines

Spacey benutzt, andere Bibliotheken,

Ines

die Modelle, das ist meistens

Ines

Python. Du kannst unglaublich viel

Ines

machen, was das

Ines

Laden von Daten, Streamen

Ines

und so weiter angeht.

Ines

das ist alles möglich, das ist alles gelöst.

Ines

Und da ist auch unsere Philosophie generell,

Ines

wir wollen es Entwicklern ermöglichen, Code zu schreiben.

Ines

Wenn du Code schreiben kannst, ist es immer besser.

Ines

Du möchtest nicht nur einen Button haben, auf den du klicken kannst.

Ines

Ein Button, auf den du klicken kannst, ist cool,

Ines

aber wenn du mehr machen möchtest, solltest du die Möglichkeit haben.

Ines

Und für Entwickler ist einfach Code die beste Art und Weise.

Dominik

Was kann man denn machen mit den Daten,

Dominik

um die vorzubereiten oder aufzubereiten

Dominik

für Spacey oder mit Spacey sogar

Dominik

mit den Daten?

Ines

Also es kommt natürlich darauf an, was man machen möchte.

Ines

Also meinst du mit Vorbereiten, okay, du hast halt

Ines

rohen Text und du möchtest

Ines

halt etwas damit trainieren und du möchtest den

Ines

annotieren?

Ines

Ja, also

Ines

erst mal, die Daten

Ines

musst du natürlich annotieren und

Ines

die in Format bringen, damit

Ines

du zum Beispiel dein Modell damit

Ines

trainieren kannst. Und

Ines

eine Option ist, du kannst ganz

Ines

Oldschool in einer Excel-Tabelle machen,

Ines

du kannst es ganz Oldschool

Ines

in JSON machen

Ines

und das wirklich eintippen, von hier bis da

Ines

ist eine Person oder das und das ist

Ines

das Label, so wird es auch oft gemacht.

Ines

Dann natürlich mit einem Tool wie Prodigy

Ines

sagen wir, hey, du kannst einfach deine Daten

Ines

rein streamen, du kannst ein bisschen

Ines

klicken, du kannst auch

Ines

Sachen ein bisschen automatisieren, das ist halt auch immer cool,

Ines

denn

Ines

als Menschen,

Ines

wir sind einfach, es gibt

Ines

viele Dinge, die wir einfach schlechter können,

Ines

als ein Computer. Ist halt nun mal so.

Ines

Unser Erinnerungsvermögen

Ines

ist schlecht, wenn es darum

Ines

geht, Dinge zuverlässig,

Ines

immer konsistent,

Ines

genau gleich zu machen, können wir nicht.

Ines

Und das sind nun mal

Ines

Dinge, dafür haben wir Computer entwickelt,

Ines

das kann ein Computer halt besser. Deswegen sagen wir halt,

Ines

wenn du halt Dinge,

Ines

die sehr

Ines

ein bisschen

Ines

stupide, wir nicht sagen stupide,

Ines

aber wo du immer das Gleiche machen musst,

Ines

das kann halt auch ein Computer machen. Du kannst ein Computer sagen,

Ines

okay, ich bin mir relativ sicher, dass Berlin eigentlich immer eine Stadt ist.

Ines

Und wenn nicht, gut, dann kann ich das korrigieren.

Ines

Das heißt, du kannst dir Workflows bauen, wo du sagst,

Ines

hey, ich habe hier ein paar Beispiele für das,

Ines

was ich quasi in meinen Daten labeln möchte.

Ines

Das mache ich jetzt automatisch und gucke mir das nur an.

Ines

Und wenn irgendwas falsch ist, dann korrigiere ich das.

Ines

Oder du hast schon ein Modell, das sagt ein paar Dinge voraus,

Ines

ist aber nicht so gut.

Ines

kannst du sagen, cool, Modell, label mir das schon mal

Ines

und ich gucke mir das noch an.

Ines

Das ist was, was du machen kannst.

Ines

Und am Ende, okay, am Ende kriegst du die Daten raus

Ines

und kannst dann dein Modell damit trainieren.

Ines

Aber da fängt es halt auch, ich würde sagen, da fängt es halt erst an.

Ines

Das ist halt der erste Schritt.

Ines

Und das Lustige ist oft, wenn man halt hört,

Ines

wie Leute sich über diese Themen austauschen,

Ines

klingt es danach, als wäre es dann schon vorbei.

Ines

Cool, du labelst so ein bisschen deine Daten,

Ines

dann trainierst dein Modell, fertig.

Ines

Aber natürlich ist es immer ein iterativer Prozess. Dein Modell musst du immer weiter trainieren, genauso wie du deinen Code auch ständig refactors und weiterentwickelst. Das ist nicht statisch. Oder eine Webseite. Du kannst eine Webseite dir entwickeln lassen, den Auftrag geben, aber die musst du halt auch updaten.

Ines

Und wenn du jemanden beauftragst, dir eine Webseite zu machen,

Ines

willst du normalerweise auch, dass die Webseite,

Ines

dass da eine Möglichkeit ist, dass du die auch später updaten kannst

Ines

und du nicht jedes Mal deinen Webmaster anrufen musst,

Ines

wie in den 90ern oder so.

Ines

Und deswegen, okay, einmal du hast deine Daten,

Ines

meistens irgendwas geht schief, irgendwas funktioniert nicht.

Ines

Dann guckst du dir oft an, okay, was sind die Probleme?

Ines

Was könnte das drüber aussagen?

Ines

Da musst du ein bisschen, oft auch, okay, ein bisschen logisch drüber nachdenken.

Ines

Okay, wie funktioniert das Modell? Was ist hier vielleicht das Problem?

Ines

Was haben die Beispiele gemeinsam, die halt nicht so gut funktionieren?

Ines

Vielleicht brauche ich auch einfach ein bisschen mehr Daten.

Ines

Ich habe nur sehr wenige Beispiele aus diesem Bereich.

Ines

Mal gucken, wie es funktioniert, wenn ich einfach ein bisschen mehr hinzugebe.

Ines

Oder vielleicht, anstatt zu sagen, ich habe jetzt ganz spezielle Kategorien für Stadt, Kreis, Bundesland oder so, vielleicht mache ich es ein bisschen allgemeiner, denn oft ist das ja, vielleicht macht es so, dass die Modelle ein bisschen einfacher sagen, okay, du musst nicht nur im Kontext erkennen, handelt es sich um eine generelle Ortschaft, ein Land, ein Kontinent, ein Kreis, ein Bundesland.

Ines

Und das ist oft vielleicht ein bisschen einfacher

Ines

im Kontext vorher zu sagen.

Ines

Und dann kannst du immer noch sagen,

Ines

okay, ist das, sobald ich weiß, da geht es um eine Lokalität,

Ines

habe ich einen zweiten Prozess, der dann sagt,

Ines

okay, der grenzt das ein bisschen mehr ein und so weiter.

Ines

Das sind alles die Entscheidungen, die man halt treffen muss,

Ines

die auch oft sehr spezifisch sind und darauf ankommen,

Ines

was man halt für ein Problem lösen möchte.

Jochen

Ja, also so in der Praxis kriegt man dann immer oft so,

Jochen

was ich bei Textkategorisierungen

Jochen

dann die ganze Zeit gemacht habe,

Jochen

war halt so, in einem Preisvergleich

Jochen

Angebote in Kategorien sortieren

Jochen

und da ist es halt zum Beispiel,

Jochen

merkt man dann, wenn man viele Angebote

Jochen

hat und auch viele immer neu dazukommen von

Jochen

irgendwelchen Shops, die man vorher noch nicht gesehen hat,

Jochen

dass es unter Umständen sehr sinnvoll ist, so eine Kategorie

Jochen

zu haben wie

Jochen

alle Dinge, für die wir keine Kategorie haben, weil

Jochen

ansonsten verteilen die sich halt

Jochen

in alle Dinge, wo man eine hat

Jochen

und das ist gar nicht gut, weil dann

Jochen

Und dann denkt man sich, wo kommt dieser Kraml mal her?

Jochen

Ja, genau.

Ines

Einerseits willst du dir natürlich vorher idealerweise Gedanken machen,

Ines

wie ordne ich das ein.

Ines

Du möchtest auch nicht, dass du während du das annotierst,

Ines

dass jeder dann einfach mal,

Ines

oh, hier habe ich noch eine Idee für eine Kategorie.

Ines

So stellen sich das auch manchmal Leute vor,

Ines

aber das ist natürlich nicht sinnvoll.

Ines

Aber andererseits musst du dir auch überlegen,

Ines

okay, wie gehe ich damit um?

Ines

100 pro, du hast 1000 Beispiele annotiert.

Ines

Und dann denkst du, ja, Mist,

Ines

nee, hätte ich jetzt doch noch mal eine andere Kategorie machen sollen.

Ines

Und dann willst du einen Workflow haben, bei dem du das relativ easy machen kannst und wo du nicht sagst, ja toll, jetzt muss ich nochmal ganz von vorne anfangen oder ja, jetzt, keine Ahnung, jetzt habe ich meinen ganzen Fortschritt hier verloren und so weiter.

Ines

Also das ist alles richtig. Und noch ein ganz anderes Thema, oder ein ähnliches Thema ist, du enkodierst immer eine gewisse Voreingenommenheit in dein Modell. Das liegt schon daran, dass Sprache ist voreingenommen und das ist ja auch nicht unbedingt schlecht.

Ines

Also die Idee, okay, wenn du jetzt irgendwelche Texte aus den 60ern analysierst, da gibt es bestimmte Dinge, da kommen halt mehr Männer vor und keine Frauen, da ist die entsprechende Sprache gewählt.

Ines

Wenn du dir da, oder wenn du dir, weiß nicht, Hasskommentare auf Twitter analysieren möchtest, da ist, das ist auf jeden Fall relativ speziell und du möchtest ja auch, dass das Modell sowas sieht, aber du möchtest nicht unbedingt, dass dein Chatbot am Ende Twitter-Kommentare generiert, genau, oder du trainierst dein Modell für Personennamen und da in deinen Beispielen, da haben alle so schöne deutsche Namen wie Jochen und das funktioniert auch total super

Ines

und dann setzt du das in der Praxis ein,

Ines

wo auf einmal Leute nicht so typisch klassische deutsche Namen haben

Ines

und dann geht das nicht.

Ines

Und dann können die Leute deine Tools nicht nutzen

Ines

oder haben dann ganz komische Probleme.

Ines

Und das ist natürlich auch was,

Ines

dass du erst rausfindest, wenn du mit den Daten arbeitest

Ines

und da tatsächlich iterierst.

Ines

Und...

Jochen

Ja, ich glaube, das ist auch

Jochen

das stellen sich viele Leute

Jochen

meistens dann zu einfach vor.

Jochen

Ja, es ist

Jochen

ja, und gute Tools

Jochen

an der Stelle. Sprache ist

Jochen

messy irgendwie, ja.

Ines

Ja, und es macht auch spannend,

Ines

aber

Ines

es ist durchaus, also man, ich glaube,

Ines

ja, man kommt nicht drum rum,

Ines

sich auch wirklich Gedanken zu machen.

Ines

Ja, von Ärger.

Ines

es klingt so, ah, Künstliche Intelligenz

Ines

macht das alles für uns.

Ines

Nein, wenn du es benutzen möchtest

Ines

und da wirklich,

Ines

und nicht nur, du musst dir Gedanken machen, du solltest dir Gedanken machen.

Ines

Ich finde es wichtig, dass wir uns alle

Ines

Gedanken machen über das, was wir

Ines

entwickeln,

Ines

was wir erreichen wollen, wie wir das

Ines

machen, ob es Sinn macht,

Ines

was da für Probleme auftreten

Ines

können und eben auch,

Ines

wie es funktioniert. Ich glaube, es ist wichtig

Ines

zu verstehen, grob,

Ines

wie funktionieren diese Modelle

Ines

was passiert da, auf welcher Basis

Ines

machen die Vorhersagen

Ines

und was bedeutet das am Ende

Ines

und das bedeutet nicht, dass

Ines

jeder genau im Detail

Ines

Machine Learning verstehen muss

Ines

genauso wie natürlich, wenn du dein Auto fährst

Ines

musst du nicht verstehen, wie das Auto genau

Ines

funktioniert, aber bis zum

Ines

gewissen Grad ist es durchaus wichtig

Ines

und deswegen finde ich es auch

Ines

teilweise problematisch

Ines

wenn das so ein bisschen in

Ines

manchen Tools oder in manchen

Ines

Produkten so komplett wegabstrahiert

Ines

wird. So, uh, gib irgendwas ein, unsere

Ines

magische künstliche Intelligenz macht das alles

Ines

für euch. Und ich glaube,

Ines

da das Problem ist, das ist halt

Ines

schon allein

Ines

für die

Ines

Benutzer das deutlich

Ines

intransparenter macht, was da eigentlich

Ines

passiert. Obwohl

Ines

eigentlich, glaube ich, auch der Endbenutzer sollte sich überlegen,

Ines

okay, was geht da ab?

Ines

Was, oder wenn, okay,

Ines

eine KI macht das. Die erste

Ines

Frage sollte sein, okay, womit wollt ihr die trainieren?

Ines

oder auch, genau, in der Medienberichterstattung.

Ines

Okay, cool, irgendwas mit KI, auf welcher Basis denn, was macht das?

Ines

Und das einfach ein bisschen kritischer zu hinterfragen

Ines

und ich glaube, dahin kommen wir nur, wenn wir halt, ja, auch dafür sorgen,

Ines

dass jeder so ein bisschen grob eine Idee hat, wie das so funktioniert

Ines

und das ein bisschen einschätzen kann.

Jochen

Ja, das ist momentan halt so eine Übergangszeit, wo teilweise die Erwartungen halt total übertrieben sind, auf der anderen Seite halt nicht klar ist, was alles an tollen Sachen schon geht, wo man sich denkt, wo dann Leute sagen, ja, das geht ja dann auf keinen Fall und man denkt so, ja doch, eigentlich schon, das geht ja schon.

Ines

Das ist halt ein bisschen undiintuitiv, was auf einmal funktioniert und was halt nach wie vor schwer ist, weil es halt auch nicht immer proportional ist zu dem, was man sich so vorstellt.

Jochen

Und es ändert sich halt gerade und dann hat man mühselig gelernt, dass dies oder jenes nicht geht und dann ist das Wissen ja auch nur ein paar Jahre alt und dann plötzlich ist es aber schon veraltet und das geht in anderen Bereichen ja nicht so. Da stimmt das halt alles noch, wenn man das mal gelernt hat und ja, das macht halt viele Verwirrungen irgendwie auf allen Ebenen.

Ines

Ja, es ist auf jeden Fall eine spannende Zeit, aber ich glaube, es gibt viele Möglichkeiten und ich glaube auch, es gibt viele Anwendungsbereiche, wo auch wirklich diese neuen Technologien einen großen Unterschied machen können.

Dominik

Das würde mich jetzt tatsächlich auch nochmal interessieren, also was für Anwendungsbereiche es denn da für alles gibt. Also Chatbots haben wir jetzt irgendwie schon gesagt oder jetzt Nachrichtenportale, die irgendwelchen Content generieren möchten oder sowas.

Ines

Ja, also ich meine, eigentlich im Endeffekt, klar, alles, wo du halt Text hast und was damit machen möchtest, aber tatsächlich, was ich immer sagen muss, es gibt natürlich so wow, fancy Dinge, die Leute entwickelt haben, die ganz cool klingen und im Endeffekt vielleicht gar nicht so, ja, so einen großen Unterschied machen praktisch.

Ines

Und da gibt es viele Dinge, die uns im Alltag begegnen, die relativ langweilig klingen, wo du aber dann siehst, oh, das macht wirklich was. Oder auch schon allein für eine Firma intern, wenn die irgendwelche Dinge optimieren, die vielleicht vorher von Menschen manuell gemacht wurden oder wo eben entsprechende Fehler passieren können, den man so ein bisschen vorbeugen kann.

Ines

ich weiß nicht, die Zentralbanken ihren Zinssatz besser anpassen können.

Ines

Das klingt erstmal super lame, ist jetzt nicht,

Ines

nee, das ist jetzt als Beispiel so, so beginn, next,

Ines

aber das ist tatsächlich was, was entsprechend auch einen sehr positiven Einfluss hat

Ines

auf die Welt, auf die Wirtschaft, unser generelles Zusammenleben,

Ines

also auch komplett, das ist noch nicht mal so ein Beispiel, wo du sagst,

Ines

hier Finance, Evil,

Ines

sondern das ist

Ines

objektiv zu sagen, okay gut,

Ines

davon

Ines

haben wir eigentlich alle was.

Ines

Jetzt

Ines

als Beispiel, aber auch

Ines

ja, also

Ines

ich würde schon sagen,

Ines

die

Ines

Sachen,

Ines

die relativ gut funktionieren,

Ines

sind nicht immer die

Ines

sexiesten, wie man so gerne sagt,

Ines

aber

Ines

ja.

Jochen

Ja, ich meine, ich kenne es halt

Jochen

häufig, ich weiß nicht, ob das jetzt die Welt wirklich

Jochen

besser macht, aber es wird viel verwendet

Jochen

eben in diesem ganzen Bereich, Werbung

Jochen

irgendwie automatisieren

Jochen

in gewisser Weise.

Ines

Da kann man sich, glaube ich, schon, da kann man sich tatsächlich

Ines

überstreiten.

Ines

Was passiert eigentlich, wenn man so etwas wie

Dominik

Spacey auf Python als Sprache

Dominik

lassen würde, also Text in Python

Dominik

hatte eine Programmiersprache.

Dominik

Also Spacey jetzt an sich

Dominik

ist schwer zu sagen,

Ines

weil natürlich die Implementationen,

Ines

die wir jetzt entwickelt haben, die sind natürlich so ein bisschen

Ines

getönt auf tatsächlich die natürliche Sprache.

Ines

Aber es gibt sehr interessante Projekte

Ines

zu

Ines

Source-Code

Ines

Analyse

Ines

mit Machine Learning. Ich glaube GitHub hat dazu

Ines

auch was gemacht.

Ines

Das war sehr spannend und

Ines

ja, es gibt auch ein paar Projekte, wo du

Ines

halt siehst, oh cool,

Ines

Auch dieser generative Ansatz, der funktioniert ja auch.

Ines

Du kannst ja auch sagen, basierend auf diesen Wörtern

Ines

oder diesen Tokens im Programmierensinne,

Ines

sage die Nächsten voraus.

Ines

Und so kannst du tatsächlich, und dann kannst du natürlich als,

Ines

ja, du kannst natürlich sagen, was am Ende raus,

Ines

das Ding produziert, muss natürlich gültiger Code sein,

Ines

der auch läuft.

Ines

Und so haben auch Modelle entwickelt,

Ines

die natürlich dann

Ines

programmieren können, also

Ines

quasi reflektieren können, was sie

Ines

irgendwie, was andere Leute auf GitHub

Ines

gepostet haben. Oder der super

Dominik

Autocompetition oder sowas, das ist ja irgendwie dann auch

Dominik

relativ nah dran. Das ist zum Beispiel ein Bereich,

Ines

wo ich sage, okay, das macht natürlich Sinn

Ines

oder auch, wenn jetzt rein theoretisch, stell dir

Ines

vor, du könntest sowas auf, wenn du hast eine

Ines

riesen Codebase und du könntest sowas trainieren

Ines

für deine eigene Codebase,

Ines

das wäre zum Beispiel noch mal cooler

Ines

als jetzt, okay, auf der Basis von

Ines

vom ganzen Internet oder du hast, du

Ines

finden.

Ines

an mit so einem relativ

Ines

generischen Modell, das jetzt irgendwie auf

Ines

GitHub alles mögliche gesehen hat, dann passt das

Ines

so ein bisschen an mit deiner Codebase und

Ines

dann könnte es zum Beispiel dein Editor sagen,

Ines

ja, hier hast du aber einen Namen benutzt,

Ines

der irgendwie sieht

Ines

komisch aus oder diese Variable

Ines

das sieht irgendwie,

Ines

das passt nicht und dann kannst du sagen, ah ja,

Ines

stimmt, das war nicht so guter Stil

Ines

oder stimmt, so machen

Ines

wir das ja eigentlich nicht in dieser Codebase. Das ist

Ines

zum Beispiel ganz spannend, aber das ist auch wieder

Ines

sowas, das ist cool,

Ines

Aber ist jetzt vielleicht nicht so

Ines

hypig wie, wow,

Ines

AI schreibt jetzt,

Ines

programmiert jetzt für uns.

Ines

Aber man muss eben auch sagen,

Ines

auch selbst wenn du eben solche Modelle

Ines

trainierst, die eben

Ines

die nächsten Wörter vorhersagen, die können super

Ines

interessante Dinge ausgeben.

Ines

Aber im Endeffekt,

Ines

dein Modell ist kein Programmierer.

Ines

Dein Modell kopiert

Ines

Programmierer.

Ines

Genauso wie wenn du jetzt irgendwie

Ines

so ein Modell fragst

Ines

zu medizinischen

Ines

Themen oder so, auch wenn das das ganze Internet

Ines

gelesen hat, das kann sich

Ines

dann als Doktor ausgeben oder so,

Ines

als Arzt ausgeben oder es kann sich als

Ines

es kann genau

Ines

diesen Text produzieren,

Ines

aber es kann nicht unbedingt

Ines

Krebs heilen, weil es eben

Ines

nur das

Ines

repliziert, was

Ines

existiert

Ines

an Text über

Ines

die Heilung von Krebs zum Beispiel.

Ines

Und deswegen, ich glaube auch so, brauchen wir bald keine Programmierer mehr, ich finde das ist immer ein bisschen, ich finde auch, man kann sich Webentwicklung angucken, das ist ein ganz gutes Beispiel, da ist einfach ein paar Jahre voraus, die Tatsache, dass jeder, jedes Café jetzt sich eine Webseite einrichten kann, bedeutet nicht, dass wir keine Webentwickler mehr brauchen.

Ines

Im Gegenteil, das ist als Beruf gefragter denn je. Es ist nur, ja, bestimmte Teile der Technologie sind halt zugänglicher, aber es gibt nach wie vor genug Leute, die daran arbeiten und es bedeutet auch, dass Firmen viel, viel mehr investieren.

Ines

Jede Firma hat große Abteilungen, die sich halt mit Web, Apps, User Experience und so weiter beschäftigen.

Ines

Das ist ganz normal.

Ines

Und das geht auch nicht zurück, nur weil sich jeder jetzt irgendwie einen Online-Blog einrichten kann.

Dominik

Was sich halt vielleicht dann doch verändern könnte, ist halt irgendwie die Art und Weise, wie man sowas macht.

Dominik

Also dass man halt jetzt nicht vielleicht pure Syntax schreibt, sondern vielleicht irgendwie auch logische Gedanken irgendwie formulieren kann

Dominik

und die Syntax dafür dann übernommen wird vom Alkoholismus.

Dominik

Ich weiß nicht, ob das wirklich gehen kann.

Ines

Ja, also ich glaube auch generell für andere professionelle Anwendungen oder es gibt ja auch viele Leute, die professionell arbeiten, ob es jetzt Buchhalter sind, Anwälte, Ärzte, die benutzen ja auch professionelle Software und die benutzen auch Tools und die benutzen auch Dinge, mit denen sie auf eine gewisse Art irgendwie programmieren.

Ines

Auch jemand, der nur in Excel arbeitet oder auch jemand, der sich nur irgendwelche Suchquerys eingibt in irgendeine Datenbank oder so, das ist auch eine Art von Programmieren und das sind auch alles Tools, die man entsprechend verbessern kann oder wo man einfach dem Nutzer bessere Tools zur Hand geben kann, um einfach besser arbeiten zu können.

Ines

Und das heißt nicht unbedingt, dass man ein magisches KI-Modell hat, das auf einmal den Anwalt ersetzt oder den Arzt ersetzt oder den Buchhalter ersetzt, sondern…

Dominik

Bei den einen wäre es mehr, bei den anderen weniger, schade.

Jochen

Ja, wobei ich mich da auch manchmal frage, ob das nicht so ein Bias ist, den man hat, dass man denkt, dass da bestimmte Berufsgruppen, die halt ein traditionell hohes Ansehen haben, vielleicht gar nicht so unersetzt sind.

Jochen

also ich denke jetzt gerade an sowas wie Lehrer zum Beispiel,

Jochen

wo man sich sagt, ja gut, also wenn das

Jochen

jetzt mit dem, also vorher fand man

Jochen

das vielleicht mit irgendwie

Jochen

Remote-Dinge unterrichten oder so,

Jochen

pui bäh, und jetzt konnte man halt

Jochen

nicht anders und jetzt haben die Leute gesehen, ah, es geht ja doch,

Jochen

ist ja gar nicht so schlecht, warum

Jochen

ist das eigentlich besser,

Jochen

wenn das jemand, der aus dem gleichen

Jochen

Dorf kommt, wie ich macht,

Jochen

sozusagen, und könnte es nicht auch sein,

Jochen

dass ich da jemandem zuhöre,

Jochen

der wirklich richtig Ahnung davon hat, der muss aber

Jochen

nicht unbedingt hier sein.

Jochen

Hm, also es könnte schon sein, dass sich...

Ines

Ich finde es schon spannend, was sich halt ja auch jetzt durch die Situation, die Corona-Situation da entwickelt.

Ines

Und man muss auch, was jetzt Jobs angeht, man muss es natürlich realistisch sehen.

Ines

Es gibt viele Jobs, die werden wegfallen oder die sind bereits weggefallen und werden durch Technologie generell wegfallen.

Ines

Und das betrifft entsprechende Menschen und das betrifft auch entsprechende Bevölkerungsgruppen.

Ines

Und eben leider auch entsprechende Bevölkerungsgruppen, die schon eh weniger privilegiert sind als andere.

Ines

Das ist die Praxis. So ist es.

Jochen

Meistens so, aber ich weiß gar nicht, ob es diesmal so unbedingt sein muss.

Jochen

Oder mich würde es freuen, wenn es auch mal andere trifft.

Jochen

Aber gut, keine Ahnung. Vielleicht trifft es auch immer die gleichen.

Ines

Die Sache, das ist halt immer ein viel tiefgehendes Problem.

Ines

Natürlich, grundsätzlich ist es ja nicht schlecht.

Ines

Wenn wir alle weniger arbeiten müssten, wäre das toll.

Ines

Aber das Problem ist, wie alles in unserer Welt, in unserer Gesellschaft, wird sich dieser Vorteil eben nicht proportional auf uns alle verteilen, genauso wie sich das Geld nicht proportional, uns geht es ja viel, viel besser, wir verdienen alle viel, viel, viel mehr Geld im Schnitt, so, aber das Geld verteilt sich leider nicht proportional auf uns alle, sondern nur auf sehr wenige.

Ines

Das heißt, und genauso wird es natürlich, es ist eher naiv anzunehmen, dass sich der Vorteil aus weniger Arbeit und Automatisierung auf einmal schön gleich auf uns alle verteilt, dass wir da alle was von haben.

Ines

Natürlich, aber das ist auch was, was man sich bewusst machen muss, wenn man auch an diesen Technologien arbeitet, aber was man auch andererseits nicht mit Technologie magisch lösen kann, wie viele andere Probleme auch.

Dominik

Also ein paar Sachen stelle ich mir wirklich dann doch, sowas wie der automatische Winkeladvokat oder sowas tatsächlich, das wäre doch was, was man gebrauchen könnte. Man braucht halt nicht mehr diese menschliche Komponente, sondern man hat eine automatische Komponente, die relativ genau weiß, wie man so Sachen wie Gesetzestexte interpretieren kann, die ja, ich sag mal, relativ wenig Interpretationsspielraum lassen sollten, aufgrund der Formulierung eigentlich.

Jochen

Ich weiß nicht, ist es einfacher, juristische Texte zu verarbeiten?

Ines

Also wenn Juristen, das ist ein interessanter Bereich, da gibt es zum Beispiel auch eine Bibliothek, die auf Spacey aufbaut, die ein Entwickler, der eben auch Jurist ist, entwickelt hat. Das ist auch was, was ich sehr toll finde, dass halt in unserem Bereich, da wir natürlich auch, wir wollen sicher gehen, dass auch Spacey relativ, zumindest der Einstieg leicht ist. Es ist unglaublich leistungsstark, aber du kannst auf jeden Fall relativ einfach anfangen und das ermöglicht eben auch Leuten, die vielleicht aus einem anderen Bereich kommen, zu sagen, cool, ich habe mir ein bisschen Programmieren beigebracht, ich möchte jetzt anfangen, in dem Bereich zu arbeiten.

Ines

Und da gibt es ein paar Pakete, die halt Entwickler entwickelt haben. Und eins davon nennt sich Blackstone. Das beschäftigt sich eben mit juristischen Texten auf Englisch erstmal. Und da kann man auch ganz spannende Sachen machen.

Ines

Und ich glaube, es ist nicht, ja, ich glaube, es ist leider halt nicht so einfach, dass Juristendeutsch oder Juristensprache ist halt so kodiert, dass es eh immer der gleiche ist.

Ines

Aber es gibt, ich glaube tatsächlich, es gibt, weil es halt so eine Formel, weil es sehr formulärisch ist, sagt man das so.

Ines

Formal, formulisiert.

Ines

Formal.

Ines

Irgendwie so, ich weiß nicht.

Ines

Ja, das war jetzt so ein Anglizismus-Fail, also formulaic wollte ich sagen.

Ines

Ah, ja.

Ines

Egal, also

Ines

es ist auf jeden Fall sehr spannend, aber natürlich, was man

Ines

zum Beispiel auch im juristischen Bereich, du musst ja auch

Ines

immer bedenken, am Ende sitzt da ein Richter oder so,

Ines

wie jetzt in

Ines

vielen Fällen, und trifft eine

Ines

Entscheidung. Und das ist auch eine Entscheidung basierend

Ines

auf einer

Ines

menschlichen Interpretation.

Ines

Und das steht ja nach wie vor

Ines

am Ende. Und

Ines

klar, man kann so ein bisschen, natürlich,

Ines

man kann Technik nutzen, um Fehler

Ines

zu vermeiden. Es gibt viele Dinge,

Ines

wo man sagen kann, okay, du hast ganz viele Dokumente,

Ines

da kannst du ein Computer drüber lesen lassen,

Ines

wenn da irgendein Problem ist, wenn irgendwas anders ist,

Ines

wenn irgendwas verdächtig aussieht, kannst du da halt nochmal Aufmerksamkeit ...

Dominik

Ich glaube, der Algorithmus könnte an der Stelle zum Beispiel

Dominik

relativ genau vorhersagen, was so der Spielraum realistischerweise denn ist.

Dominik

Ich meine, man kann jetzt irgendwie in einem juristischen Kommentar nachschlagen

Dominik

und gucken, wie könnte denn der jeweilige Sachverhalt interpretierbar sein.

Dominik

Und ich glaube, sowas kann halt der Algorithmus auch recht gut.

Ines

Also ich meine, man kann vielleicht diese Recherche, die vielleicht ein Jurist machen kann, aber man muss auch wieder vorsichtig sein, denn am Ende, worauf basiert dein Modell? Dein Modell basiert vielleicht auf anderen Entscheidungen. Dein Modell kann vielleicht replizieren, was in der Vergangenheit entschieden wurde. Ist das denn immer gut?

Ines

Das ist ja das Straßenverkehrsrecht trainiert.

Ines

übertreiben und dann Leuten zu erzählen,

Ines

die ist 99,9%

Ines

korrekt oder so.

Ines

Was natürlich, schon allein

Ines

wenn du sowas hörst, da müssen die eigentlich

Ines

die Alarmglocken angehen. Aber

Ines

Leute glauben das, weil ja,

Ines

ist halt künstliche Intelligenz und

Ines

dann soll

Ines

diese künstliche Intelligenz entscheidet dann halt, ob

Ines

jemand auf Bewährung entlassen wird oder nicht.

Ines

Auf der Basis von, keine Ahnung,

Ines

unklar, wird ja nicht gesagt, aber

Ines

angeblich 99,9%

Ines

korrekt oder so.

Ines

Und da sind natürlich alle Entscheidungen, die Menschen gemacht haben, inklusive jeglicher Voreingenommenheit, ob gut oder ob schlecht, drin widergespiegelt.

Ines

Aber andererseits gibt den Menschen das schöne Gefühl, das sind ja nicht wir, wir müssen ja jetzt die Entscheidung treffen.

Ines

Das ist ja das System.

Ines

Und das ist sehr, sehr gefährlich.

Ines

Und eigentlich, was ich immer finde,

Ines

Leute denken immer an diese Dystopie,

Ines

wo die KI uns alle, weiß ich nicht, umbringt

Ines

oder schlauer ist als wir alle

Ines

und die Technologie funktioniert

Ines

und die uns dann alle unterdrückt oder sowas.

Ines

Aber was viel, viel gefährlicher ist,

Ines

ist eine Zukunft, die auch viel früher passieren wird,

Ines

wo es so lala funktioniert, wie momentan schon.

Ines

Manches funktioniert ganz gut, manches halt nicht.

Ines

Aber wo es gefährlich wird,

Ines

ist, wenn

Ines

die Allgemeinheit glaubt, dass es funktioniert.

Ines

Das ist viel, viel gefährlicher als so eine dystopische

Ines

KI-Zukunft, wo die Maschinen

Ines

alles super machen

Ines

und auf einmal super intelligent sind.

Jochen

Ja, wenn sie super intelligent werden, vielleicht machen sie es dann ja auch gut.

Jochen

Wer weiß.

Jochen

Aber auch wenn wirklich die Idee

Ines

zumindest, diese Prämisse funktioniert.

Ines

Was gefährlich ist,

Ines

wenn du hast da ein System, was irgendjemand

Ines

so zusammengehackt hat mit allem möglichen

Ines

Zeugs, was gar nicht

Ines

wirklich funktioniert.

Dominik

Golden Age für gute Entwickler, die können ja einfach

Dominik

dann so tun, als haben die ein gewünschtes Ergebnis

Dominik

und alle Leute glauben, was sie da erzählen.

Dominik

Ja, genau, das ist unglaublich.

Ines

Zum Beispiel, auch hier historisch

Ines

vielleicht ganz relevant, auch so für uns,

Ines

dann kommt

Ines

jemand an und holt deinen Nachbarn ab,

Ines

weil das KI-System

Ines

das 99,9%

Ines

korrekt legt, gesagt hat, dass der ein Terrorist

Ines

ist. Dann sagst du dir, ja,

Ines

also du hoffentlich jetzt nicht, aber so,

Ines

dann sagen sich viele Leute, ja gut, wenn das

Ines

halt so ist, ist halt

Ines

die Technologie, wenn die, das ist ja

Ines

99,9 Prozent, das muss schon richtig sein.

Ines

Und

Ines

das ist sehr düster und

Ines

das ist genauso düster,

Ines

wenn das halt, was weiß ich, überhaupt nicht funktioniert

Ines

und so ein komisches Modell ist, was man immer trainiert hat.

Ines

Ja, aber solche Modelle gibt's

Ines

ja schon. Wenn es halt gut genug funktioniert,

Ines

wenn es halt gut genug funktioniert, dass man

Jochen

es einsetzt, aber einem

Jochen

dann halt egal ist, dass es halt sehr ungerecht ist

Jochen

und man sich dann auch nicht mehr dafür verantworten muss,

Jochen

weil es hat ja der Computer entschieden, dass es schon,

Jochen

Das ist halt so ein bisschen wie eben, man geht zur Bank

Jochen

und die hat einem gesagt, so, nee, kein Kredit für dich

Jochen

heute. Schade.

Jochen

Wo du halt irgendwie so

Jochen

Bewegungen getestet werden.

Dominik

Wo du halt von oben so Drohnen hast, die gucken, was du halt machst.

Dominik

Und wenn du dich halt auf den Parkplan setzt und halt

Dominik

dem Strom nicht folgst oder sowas, dann

Dominik

gehst du halt direkt in den Fokus desjenigen, der da

Dominik

guckt, was denn da los ist.

Dominik

Weil könnte ja sein, dass da irgendwas

Jochen

nicht in Ordnung ist. Ja, ich weiß gar nicht, wer das,

Jochen

von wem dieses Bild war, aber

Jochen

im Grunde,

Jochen

wenn man Leuten

Jochen

vermitteln möchte, was denn jetzt diese

Jochen

was denn

Jochen

in Zukunft, wie das denn funktioniert,

Jochen

dann fand ich das sehr hilfreich,

Jochen

sich das so vorzustellen, dass man sagt, naja, so

Jochen

künstliche Intelligenz, wir haben es im Grunde mit denen heute

Jochen

auch schon täglich zu tun,

Jochen

so mit denen wir es dann in Zukunft zu tun kriegen

Jochen

und zwar Unternehmen oder Organisationen,

Jochen

Behörden, die sind im Grunde schon

Jochen

sowas. Die sind nur halt sehr

Jochen

viel langsamer, aber im Grunde

Jochen

sind die so und

Jochen

man muss sich das nur vorstellen, die Dinger werden

Jochen

jetzt halt richtig schnell. So, dann

Jochen

hat man so eine Vorstellung, was da passieren

Jochen

wird. Das ist eigentlich

Ines

eine ganz gute Analogie auch, weil

Ines

okay, momentan auch so eine Behörde, okay, da hast

Ines

du entsprechende Regeln, entsprechende

Ines

Abläufe und das wird

Ines

halt reproduziert von Menschen,

Ines

die halt da sitzen am Schreibtisch.

Ines

Und ja, und am Ende kannst

Ines

du, ein Computer kann das genauso machen, natürlich,

Ines

aber ohne

Ines

ja.

Jochen

Ohne Rechtsweg, Rechtsweg ausgeschlossen.

Jochen

Ja, genau. Computer irrt nicht.

Ines

Ja, und natürlich gibt es auch Dinge, die auch natürlich ein Vorteil sein werden oder wo eben vor allem die interessanteren Sachen sind, wo eine Maschine einen Menschen unterstützen kann oder wo zum Beispiel eine Maschine auch nochmal auf ein Röntgenbild drauf gucken kann und vielleicht ein Röntgenbild nochmal entsprechend hervorheben kann, damit sich das nochmal ein Arzt anguckt oder so.

Ines

damit halt nichts übersehen wird.

Ines

Aber so muss man meiner Meinung nach auch an die Dinge rangehen.

Ines

Wenn man sieht, ein neues System kann Tumore erkennen,

Ines

kann genauso gut Tumore erkennen wie ein Mensch oder so.

Ines

Das heißt ja erstmal,

Ines

erstmal heißt das ja nicht,

Ines

dass das System überhaupt besser ist als ein Mensch.

Ines

Das heißt, dass normal,

Ines

du hast das Datenset, mit dem das trainiert wurde,

Ines

und dann hast du die Vergleichsdaten,

Ines

an denen das ausgewertet wird.

Ines

Und meistens, wenn du Menschen nochmal sowas auswerten lässt, die Menschen sind ja auch nicht hundertprozentig genau, die Menschen kriegen dann manchmal so 90% hin oder so. Und wenn du ein System hast, das auch 90% hinkriegt, dann sagst du auch genauso gut wie Mensch. Und genau, in einer ganz bestimmten Aufgabe.

Ines

Aber es ist ja nicht in so einem Bereich, wenn du das System einsetzt und das jetzt ausschließlich deine Röntgenbilder auswertet, das ist vielleicht nicht so geil. Aber wenn das System vielleicht irgendwas sieht, was ein Mensch übersehen hat, warum nicht? Kann auf jeden Fall sinnvoll sein.

Ines

Und im Bereich so gruselige Anwendungen oder so negative Dinge, ich finde, worüber nicht genug geredet wird, ist so Spam und Malware. Weil das ist tatsächlich schon sehr realistisch und das ist viel destruktiver als jetzt diese Idee, uh, werden uns die Maschinen versklaven.

Jochen

Ja, oder wahrscheinlich eher andere Menschen, die Maschinen benutzen, um uns zu versklavten. Die haben halt eine Intention, die Maschinen gar nicht so.

Ines

Ja, ich glaube, das ist

Ines

viel nähere

Ines

und realistischere Problem,

Ines

den wir uns stellen müssen.

Ines

Oder wo sich auch, glaube ich, jeder Entwickler

Ines

fragen muss, okay, was mache ich hier?

Ines

Wozu trage ich

Ines

hierbei? Ist das

Ines

gut oder schlecht?

Ines

Und ich glaube, das kann man

Ines

nicht unbedingt voneinander trennen.

Ines

Ich glaube, man kann

Ines

nicht sitzen in seinem Vakuum und sagen, oh, ist mir egal,

Ines

ich schreibe nur gut. Ja, man kann auch relativ

Dominik

wenig gegen machen. Also selbst wenn man jetzt irgendwie

Dominik

vernünftige Lizenzbedingungen nimmt, ob man da

Dominik

irgendwie dann sich aus dem Schein erhält, das ist schwierig.

Dominik

Ja, das ist auch

Ines

was, wo wir uns Gedanken machen müssen, okay, wenn wir

Ines

jetzt zum Beispiel mehr

Ines

Funktionalitäten für bestimmte Sprachen zur Verfügung

Ines

stellen, wer benutzt das?

Ines

Wer

Ines

und okay,

Ines

wir machen das öffentlich verfügbar, open source.

Ines

Wie viele

Ines

Menschen gibt es, die diese Sprache sprechen? Welche Regierungen

Ines

gibt es? Gibt es da

Ines

Problematiken, wo die

Ines

Regierung vielleicht, ja, eine

Ines

Regierung, die eben zum Beispiel

Ines

gegen entsprechende Bevölkerungsgruppen

Ines

arbeitet

Ines

und vielleicht die Möglichkeit hat,

Ines

diese Technologie am effizientesten zu verwenden?

Ines

Oder

Ines

ist es sinnvoll

Ines

für die Allgemeinheit, auch

Ines

den einzelnen

Ines

Individuen und Aktivisten oder was

Ines

weiß ich, die Möglichkeit zu geben,

Ines

die Technologie zu benutzen, wofür Open Source

Ines

natürlich eine gute

Ines

Möglichkeit ist. Also das ist auch

Ines

tatsächlich was, wo wir uns in unserem Alltag

Ines

Gedanken drüber machen müssen, okay, was

Ines

und auch vor allem, okay,

Ines

so eine Bibliothek wie Spacey

Ines

ist sehr verbreitet,

Ines

es ist sehr beliebt,

Ines

viele Leute benutzen das.

Ines

Zwei Millionen

Ines

Downloads pro Monat

Ines

gehen irgendwo raus

Ines

an irgendwelche Systeme

Ines

und an irgendwelche Server

Ines

und Dinge, die Leute damit machen.

Ines

Und in irgendwelche,

Ines

tausende Firmen, die damit auch Dinge machen

Ines

und wer weiß, wohin noch.

Jochen

Ja, es ist schwierig. Ich weiß auch nicht, inwiefern...

Ines

Natürlich, also ich bin nach wie vor Verfechter von

Ines

Open Source und ich glaube, Open Source als

Ines

einerseits natürlich als

Ines

Software-Modell, aber eben auch als

Ines

und natürlich andererseits, muss man auch sagen, als

Ines

Geschäftsmodell. Das ist ja eine...

Ines

Open Source ist ja

Ines

auch weiter und weiter

Ines

verbreitet als

Ines

Software-Vertrieb

Ines

quasi. Das ist ja auch

Ines

eine Realität der Open-Source-Software.

Ines

Irgendwie

Jochen

tatsächlich hat sich das so

Jochen

durchgesetzt irgendwie.

Jochen

Ich erinnere mich noch an, das war

Jochen

an die Halloween-Papers

Jochen

1997 von Microsoft,

Jochen

wo sie geschrieben haben, oh nein, das wird

Jochen

uns irgendwann umbringen langfristig.

Jochen

Das ist tatsächlich passiert, sehr gut.

Jochen

Aber auf der anderen Seite, Microsoft heute ist auch wieder

Ines

und Microsoft ist einer der Vorreiter

Ines

Ja, ja, ja, genau.

Ines

Im Bereich Open Source, ja.

Jochen

Hätte ich mir damals nicht träumen lassen, aber es ist tatsächlich

Jochen

passiert, ja, erstaunlich.

Jochen

Was interessant ist, finde ich auch da,

Jochen

im Bereich Open Source ist, ich glaube,

Ines

es wird oft missverstanden, Leute denken, ah,

Ines

Open Source ist verbreitet, weil es gratis ist.

Ines

Natürlich,

Ines

die Tatsache, dass es halt meist frei verfügbar ist,

Ines

ist auf jeden Fall

Ines

ein Aspekt, aber im

Ines

kommerziellen Bereich oder

Ines

was Firmen angeht,

Ines

die Tatsache, dass es gratis ist, ist nicht

Ines

unbedingt der Knackpunkt. Der Knackpunkt ist,

Ines

dass es offen ist

Ines

und dass man damit

Ines

programmieren kann. Der Code ist

Ines

da und wenn du diese Entwicklertools hast,

Ines

die eben auch Open Source sind, also Open Source

Ines

Bibliotheken, zur Verfügung gestellt

Ines

wird und die

Ines

Tatsache, dass du dich nicht auf

Ines

eine Lösung

Ines

festlegst oder auf einen Anbieter

Ines

festlegen musst und dass

Ines

du dich da nicht einschließen lässt

Ines

und diese

Ines

Autonomie bewahrst. Ich glaube, das ist in der

Ines

Praxis tatsächlich, was für Firmen deutlich

Ines

entscheidender ist, als die Tatsache, dass es 0 Euro kostet.

Ines

Denn es kostet ja in der Praxis

Ines

nicht 0 Euro, mit einer

Ines

Open-Source-Bibliothek was zu entwickeln.

Ines

Und da ist wieder

Ines

unglaublich viel Geld rein investiert in

Ines

vor allem KI, Machine Learning,

Ines

die entsprechende Entwicklung. Das sind top

Ines

bezahlte Entwickler.

Ines

Weswegen auch zum Beispiel

Ines

Entwicklertools und Developer Experience

Ines

und Tools, die halt

Ines

sowas fördern und

Ines

einfach die Entwickler produktiver machen.

Ines

großen Einfluss haben können, weil

Ines

cool, wenn dein top bezahlter

Ines

Machine Learning Entwickler

Ines

ein bisschen weniger rumsitzen muss und

Ines

ja,

Ines

stupide Arbeit machen muss und einfach besser arbeiten kann,

Ines

ist das natürlich besser

Jochen

für alle. Lohnt sich auf jeden Fall, aber

Jochen

ich weiß nicht genau, also ich habe doch häufig

Jochen

das Gefühl, dass es da so ein gewisses Marktversagen

Jochen

gibt irgendwie, weil

Jochen

wenn man jetzt sich zum Beispiel eben sowas

Jochen

anguckt wie Pandas oder Django oder

Jochen

Spaces, weiß ich es gar nicht genau,

Jochen

Aber so halt Software, die halt als Infrastruktur unter ganz, ganz vielen Produkten und bei ganz, ganz vielen Firmen sozusagen darunter liegt, dann müsste man ja jetzt meinen, so rein aus einer, gut, ich habe jetzt nicht so wirklich Ahnung von Ökonomie, aber so, dann wäre es doch für große Firmen allein schon aus so einem Versicherungsaspekt sinnvoll, die Projekte zu unterstützen, damit ihnen nicht plötzlich die Infrastruktur unter den Füßen wegbricht.

Jochen

Tatsächlich ist es aber so, dass kaum Firmen das machen.

Dominik

Das liegt daran, dass die Informationsasymmetrie nicht zu irgendwelchen kompetenteren oder, ich sag mal, Entscheidungsträgern durchdringt, die Budgetverantwortung haben.

Dominik

Die wollen halt irgendwie Sachen, Projekte bekommen und die Projektmanager, die halt dann die Projekte bestellen oder bezahlen,

Dominik

die haben vielleicht schon mal von ihren Entwicklern irgendwie so ein bisschen was von oben zugehört, das irgendwie sinnvoll wäre,

Dominik

aber dann eine Ebene weiter oben sagen dann ganz viele einfach so, ja, nee, aber das bringt uns das irgendwas, das sind die nicht so, ne, das ist schwer.

Dominik

Tja.

Dominik

Aber so eine Versuchung ist eigentlich eine gute Idee.

Ines

Also ich meine, es gibt ja verschiedene Versuche, das irgendwie zu lösen.

Ines

Es ist immer ein bisschen problematisch.

Ines

Es ist halt nicht einfach.

Ines

Und ich glaube auch, einerseits, man sieht schon, es ändert sich was, auch in großen Firmen.

Ines

Denn dieses Klischee vom alten Manager, der irgendwie kaum Computererfahrung hat, das stirbt ja langsam aus.

Ines

Du hast jetzt Leute im Management, die sind in ihren 40ern, die programmieren seit ihrer Jugend.

Ines

Das ist jetzt nicht mehr seltsam.

Ines

Und eben auch diese Idee von so dummen Management, das irgendwie keine Ahnung hat.

Ines

Gibt es immer noch, natürlich, aber in vielen Bereichen hast du halt Leute, die kennen sich aus mit Technik.

Ines

Und denen kannst du auch nicht mehr irgendwelchen Schwachsinn andrehen unbedingt.

Ines

Und die haben da auch Meinungen zu, zum gewissen Grad.

Ines

Aber ich glaube, mit Open Source, ein Problem ist, es ist ja alles nicht wirklich standardisiert.

Ines

Es gibt verschiedene Projekte, die aus den verschiedenen Motivationen heraus entstehen.

Ines

Und manche sind natürlich jetzt mittlerweile gefördert von einer Stiftung.

Ines

Das ist ja die Tatsache für viele dieser Scientific Computing-Geschichten auch im Python-Ökosystem.

Ines

Und dann gibt es aber andere Projekte.

Ines

Okay, das ist halt, irgendjemand hat das mal entwickelt, der hatte da Spaß dran.

Ines

Das wurde populär.

Ines

Und ja, jetzt sitzt da jemand mit einem erfolgreichen Projekt,

Ines

aber keinem nicht unbedingt

Ines

einem direkten Pfad

Ines

zu etwas Kommerziellem

Ines

draußen. Das kann man ja auch

Ines

dem Entwickler nicht unbedingt anlasten.

Ines

Sagen, okay, gut,

Ines

das ist halt

Ines

nun mal so und auch, okay, die Firmen,

Ines

was willst du da machen?

Ines

Es kommt halt immer darauf an,

Ines

auch auf die Motivation, die zu einem

Ines

Open-Source-Projekt führt. Es gibt andere Projekte, wo

Ines

auch Firmen

Ines

Entwickler speziell gesagt haben, okay, cool,

Ines

ich entwickle das und ich habe eine Motivation,

Ines

dass da entweder, wenn das

Ines

populär wird, kann ich das für meine Karriere

Ines

nutzen. Gibt es ja auch viele Entwickler,

Ines

die sagen, hey,

Ines

da kriege ich einen besseren Job. Funktioniert ja auch

Ines

oft. Oder in unserem Bereich, wir haben es ja auch,

Ines

die Idee war immer,

Ines

wir wollen eine Firma

Ines

gründen und wir wollen

Ines

etwas machen in dem Bereich und

Ines

in diesem Bereich arbeiten. Und die Tatsache,

Ines

okay, Spacey is open source und das ist auch

Ines

strategisch so,

Ines

Und das ist uns sehr wichtig, aber das ist eben natürlich auch Teil unserer generellen Strategie und wir sagen, okay, wir bauen, wir machen jetzt nicht so ein Open-Core-Ding, wo du halt für bestimmte Features zahlen musst, sondern wir sagen, hey, hier ist unsere Open-Source-Bibliothek, die ist gut, du kannst sie testen, du kannst damit Dinge bauen, wir geben sie dir gratis, weil wir auch glauben, okay, das, wo der meiste Wert drin steckt, sind die Daten, das ist nicht unbedingt oder deine speziellen Daten, die man auch gar nicht unbedingt so verkaufen kann.

Ines

Der Algorithmus und die Bibliothek geben wir dir gratis und wenn du unsere Sachen gut findest und damit

Ines

baust, haben wir andere Produkte,

Ines

die dir auch gefallen würden, wenn du ein

Ines

Spacey-Power-User bist zum Beispiel. Wenn jetzt

Ines

deine Firma ein System

Ines

auf Spacey aufbaut, dann willst du meistens

Ines

auch deine Systeme trainieren und dann willst

Ines

du Daten sammeln.

Ines

Und dann hast du vielleicht auch Interesse

Ines

an Prodigy und anderen Dingen, die wir

Ines

darauf aufbauen.

Dominik

Kann Spacey Emotionen erkennen?

Dominik

Ja, klar.

Dominik

Das ist eine

Ines

allgemeine Frage.

Ines

Das ist jetzt erstmal meine Antwort.

Ines

Nein, Gott, aber das ist halt sehr aufgeladene Emotionen, ist halt auch immer sehr abstrakt.

Ines

Und es ist auch etwas, was sich nicht sehr gut generalisieren lässt.

Ines

Du kannst natürlich sagen, du kannst bestimmt ein System trainieren,

Ines

auf der Basis von entsprechenden Wörtern, Ausdrücken, wie Dinge präsentiert sind,

Ines

Vorher zu sagen, in welche emotionale Richtung ein Text geht, ist ja auch sowas wie Sentiment Analysis, ist ja auch ein Thema, was sehr verbreitet ist, wo die Idee ist, okay, wie steht der Sprecher zu einem bestimmten Thema?

Ines

meistens natürlich in der Marktforschung

Ines

oder wer jetzt eine Marke Coca-Cola möchte

Ines

wissen, wie Leute über Coca-Cola reden oder

Ines

keine Ahnung. Aber

Ines

ich bin auch, was ich sehr

Ines

kritisch finde, sind diese

Ines

General Purpose

Ines

Modelle, die auch teilweise

Ines

viele Cloud-Services anbieten, die sagen,

Ines

oh, hier ist Sentiment Analysis für alles.

Ines

Denn, selbst ob was

Ines

positiv oder negativ ist oder ob was,

Ines

welche Emotionen hinter

Ines

einem etwas steht, selbst wenn du es messen

Ines

könntest, ist unglaublich

Ines

subjektiv und unglaublich

Ines

themenspezifisch.

Ines

Also, ein Beispiel, was ich zum Beispiel, glaube ich,

Ines

in meinen Talks manchmal verwende, ist,

Ines

du hast zwei Sätze.

Ines

Ich liebe Katzen und ich hasse Katzen.

Ines

Sind diese zwei Sätze ähnlich

Ines

oder nicht ähnlich?

Ines

Und teilweise frage ich, okay, kannst

Ines

mal gut Publikum fragen und meistens hast du so vielleicht

Ines

so 50-50 und für beides

Ines

kannst du begründen.

Ines

Wenn ich jetzt irgendwie generell

Ines

Text analysiere,

Ines

Relativ zu allem, was ich in der Sprache, in der deutschen Sprache sagen könnte, ist es unglaublich ähnlich. Zwei Sätze, die kurz sind und meine Haltung gegenüber Katzen ausdrücken. Das ist unglaublich ähnlich, unglaublich speziell im Vergleich zu allem anderen, was ich hätte sagen können.

Ines

Aber wenn du jetzt eine Dating-App entwickelst und du möchtest gucken, ob zwei Leute aufgrund ihrer Profile zueinander passen,

Ines

möchtest du das als sehr unähnlich ansehen.

Ines

Weil ein Katzenhasser und ein Katzenliebhaber passen wahrscheinlich nicht zusammen.

Ines

Das sind komplett polare Unterschiede.

Ines

Und so ist es auch mit eigentlich sehr, sehr vielen anderen Dingen, die man vorhersagen kann mit Hilfe von Machine Learning und eben auch Sentiment und Emotionen.

Ines

Und ich finde, es vermittelt auch so ein bisschen das falsche Bild, eben zu sagen, wir können das jetzt mit einem vortrainierten Modell lösen.

Ines

Du kannst das lösen, wenn du es eben wirklich speziell zuschneidest auf das, was du machst.

Dominik

Okay, also ob der Nachrichten-Informationswert positiv oder negativ ist, kriege ich dann für das jeweilige Unterfach.

Jochen

Hängt davon ab, wenn ich jetzt zum Beispiel, auf was ich spekuliere, wenn ich jetzt zum Beispiel Gewinn daraus ziehen möchte, wie sich der Kurs in Zukunft von irgendeinem Unternehmen entwickelt, dann spielt es halt eine Rolle, ob ich jetzt irgendwie long sozusagen gehe oder ob ich das Ding short sellen möchte und es kann halt für mich irgendwie unter Umständen eine sehr gute Nachricht sein, wenn Privatanleger in GameStop-Aktien jetzt plötzlich reingehen.

Jochen

Oder sehr schlecht.

Ines

Das Beispiel ist eigentlich auch ganz gut,

Ines

weil das illustriert auch so ein bisschen,

Ines

was man mit Machine Learning gut lösen kann

Ines

und was eben zum Beispiel nicht.

Ines

Also wir hatten, glaube ich, mal ein Beispiel,

Ines

wo jemand versucht hat auch,

Ines

ich glaube, es ging so um Supply Chain Risk und Management.

Ines

Das ist auch sowas, klingt ein bisschen öde,

Ines

aber ist tatsächlich was, was viel wert ist.

Ines

Wenn du eben sagst, okay, du hast jetzt hier einen Händler in China,

Ines

von dem beziehst du Waren, mit denen du dann irgendwas machst

Ines

Und dann hast du hier jemanden in Russland und die importieren aber von da und da und du möchtest dann wissen, wenn jetzt da und da ein Streik ist oder hier irgendwie ein Schiff untergeht oder so, wird das in der Zukunft zum Beispiel dein Unternehmen beeinflussen oder so.

Ines

Und das kannst du zum Beispiel, ein Teil davon ist, du möchtest dann Nachrichten analysieren und gucken, was ist los. Es kann ja sein, in irgendeinem kleinen Ort, in was weiß ich wo, wo jetzt zufällig gerade irgendwas hergestellt wird.

Dominik

Ja, wenn die Kategorie Emotionen katastrophal werden würde, möchtest du das für den lokalen Ort dann wissen?

Ines

Ja, oder irgendwie da und da passiert was, das möchtest du wissen und dann irgendwie zusammenhören.

Ines

Und genau, also es gab irgendein so ähnlicher Fall war das.

Ines

Und es ging einem auch darum, die Firma wollte rausfinden, okay, was ist jetzt gut für ihr Unternehmen?

Ines

Und das ist natürlich so unglaublich abstrakt.

Ines

Und der erste Schritt war, okay, die haben dann Trainingsdaten erstellt,

Ines

wo sie alles, was gut für ihr Unternehmen ist, hervorgehoben haben.

Ines

Inklusive Sachen, die komplett abstrakt waren.

Ines

Also jetzt irgendwie, oder Dinge, die schlecht sind fürs eigene Unternehmen.

Ines

Wenn dein Konkurrent irgendwas auf den Markt bringt oder so, ist das schlecht für dich und das weißt du und das ist aber was, was du nicht unbedingt einem Modell auf Basis des lokalen Kontexts beibringen kannst und dein Modell wird nicht unbedingt in der Lage sein, so zu generalisieren und zu wissen, die und die Firma ist dein Konkurrent und die Tatsache, dass die ein Produkt veröffentlichen, ist schlecht.

Ines

Aber die Tatsache, dass vielleicht dein Lieferant was veröffentlicht, ist gut.

Ines

So funktioniert das einfach nicht.

Ines

Das wird auch ein bisschen klarer, wenn du dir überlegst,

Ines

wie funktioniert das Modell und auf welcher Basis trifft das diese Vorhersagen?

Ines

Was guckt sich das an? Worauf basiert das?

Ines

Wie wird quasi die Information da enkodiert?

Ines

Und da geht es dann wieder zurück in so, wie breche ich das runter?

Ines

Oder okay, du kannst sagen, ich möchte ein Modell trainieren, das Kleidung für Erwachsene, Kleidung für Kinder, Kleidung für alte Leute oder so erkennen kann und entsprechend ordnet.

Ines

Funktioniert wahrscheinlich nicht so gut, wie wenn du sagst, ich möchte nur generell Kleidung erkennen und habe dann andere Prozesse, die das so ein bisschen weiter runterbrechen.

Ines

Denn der Kontext gibt da oft nicht so viel her und viel benötigt unglaublich viel Wissen und ist noch nicht mal so eindeutig.

Jochen

Katastrophale Beispiele waren immer sowas, also aus einer Sicht von einem Redakteur sozusagen oder wie man das verkaufen möchte, macht das durchaus Sinn, dass man Handys mit und ohne Vertrag in zwei unterschiedliche Kategorien packt. Aus Sicht von Machine Learning ist das scheiße, weil das funktioniert einfach nicht richtig.

Ines

Ja genau, sowas. Okay, gut, das kannst du dann vielleicht später machen oder du hast eine Datenbank, wo du diese Information abrufst. Und selbst wenn es neue Modelle, Architekturen und eben auch vielleicht vortrainierte Gewichtungen gibt, die das eben vereinfachen, ist immer noch die Frage, okay, willst du das tatsächlich so lösen?

Ines

Du kannst dein Problem unglaublich komplex formulieren, quasi von der Machine Learning Sicht, dann da so ein richtig krasses Modell draufschmeißen, das dann auf krassen Hochleistungsrechnern laufen lassen und damit ganz gute Resultate erzielen, wenn es eigentlich viel einfacher gewesen wäre, das einfach ein bisschen besser zu strukturieren oder ein bisschen logischer runterzubrechen.

Ines

Das ist auch die Tatsache, dass gewisse Dinge

Ines

jetzt möglich sind, heißt nicht unbedingt,

Ines

dass du es so machen musst, denn oft

Ines

wirklich

Ines

der Großteil liegt darin,

Ines

wie man das Problem definiert.

Ines

Und ein bisschen

Ines

ist natürlich, natürlich gibt es Unterschiede

Ines

und auch selbst wenn du, selbst sowas wie ein, zwei

Ines

Prozent Unterschied in Genauigkeit

Ines

kann tatsächlich einen wirklich großen Unterschied machen,

Ines

generell, also das hat einen großen Einfluss,

Ines

aber

Ines

man macht es sich viel schwerer, wenn du halt dein Problem

Ines

nicht definierst

Ines

wenn du es halt dem Modell schwerer machst, als

Ines

du es müsstest.

Ines

Ja, ja.

Ines

Aber im Grunde so ein bisschen

Jochen

eben dieses Modell bei Spacey

Jochen

klang für mich auch so nach dem,

Jochen

das ist ja auch ein Modell, das viele, viele

Jochen

Open-Source-Projekte

Jochen

oder viele Leute, die dann mal

Jochen

ein Open-Source-Projekt, das dann

Jochen

erfolgreich geworden ist, gestartet

Jochen

haben, womit sie dann Geld verdienen,

Jochen

halt sozusagen so ein bisschen Consulting.

Jochen

Also es ist bei Spacey ein bisschen anders mit dem

Jochen

Annotations-Tool, aber es ist halt auch im Grunde

Jochen

so Dienstleistungen um

Jochen

das Open-Source-Projekt

Jochen

herum quasi.

Jochen

Ja, also generell,

Ines

wir haben anfangs mal ein bisschen

Ines

Consulting gemacht, vielleicht, also

Ines

dann haben wir uns hauptsächlich auf Produkte

Ines

spezialisiert, vielleicht machen wir in Zukunft

Ines

mal ein bisschen mehr, weil es eigentlich immer ganz cool ist, auch so ein bisschen

Ines

die Connection zu haben

Ines

zu den Nutzern, aber

Ines

eine Sache, die uns immer ganz wichtig war,

Ines

war Support, finde ich

Ines

immer bei vielen

Ines

Dingen ein bisschen kritisch. Also es gibt Dinge,

Ines

so Infrastruktur oder so. Ja gut,

Ines

da braucht es, da macht es Sinn, jemanden zu haben,

Ines

dem du bezahlst, der dir das dann alles einrichtet.

Ines

Aber bei anderen

Ines

Tools, vor allem Entwicklertools,

Ines

wir

Ines

möchten ja, dass es, dass

Ines

das Tool auch wirklich benutzt wird. Es ist gut

Ines

für uns, wenn natürlich Leute unsere

Ines

Open-Source-Tools benutzen. Aber wenn

Ines

jetzt unser Hauptgeschäftszweig

Ines

Support ist, bedeutet das natürlich,

Ines

dass wir mehr verdienen, wenn Leute mehr Support

Ines

brauchen. Aber natürlich, wenn Leute

Ines

mehr Support brauchen, dann verdienen wir

Ines

aber auch andererseits weniger, weil es dann natürlich viel

Ines

weniger Leute das Ding nutzen.

Ines

Und ich finde das mal ein ganz komischer Kreislauf,

Ines

der meiner Meinung nach nicht so gut funktioniert

Ines

für viele Entwicklertools.

Ines

Aber natürlich, Dinge drumherum

Ines

ist gut. Und Open Source ist ja auch eine gute Art und Weise

Ines

zu zeigen, hey, wir können

Ines

gute Software bauen.

Ines

Also, wenn man das

Ines

strategisch so angeht, kann es

Ines

gut sein. Also, ich bin jetzt nicht der Verfechter, der sagt,

Ines

oh, jeder sollte jetzt hier seine ganze Freizeit

Ines

mit Open-Source-Projekten verdienen

Ines

und quasi gratis für Firmen arbeiten.

Ines

Aber es ist durchaus so,

Ines

dass man es auch strategisch angehen kann

Ines

und das auch ein Pfad sein kann,

Ines

erfolgreich zu sein und auch was zu machen,

Ines

was vielleicht einem Spaß macht.

Jochen

Ja, im Prinzip ist das ja super, genau.

Jochen

Also das ist ja eigentlich sozusagen,

Jochen

würde ich ja schon mal ein bisschen

Jochen

Traumleben irgendwie beschreiben

Jochen

wollen, weil das ja, ich meine, das

Jochen

stellt man sich halt so vor. Man kann halt das tun, was man möchte

Jochen

und verdient damit halt genug Geld,

Jochen

dass das halt das möglich macht.

Jochen

Und wenn das funktioniert, ist es natürlich

Jochen

großartig.

Ines

Ja, ich meine, ich glaube, man muss halt schon,

Ines

ich glaube, es macht Sinn, es auch so anzugehen, dass man

Ines

halt auch, man sollte schon ein Ziel

Ines

haben, wenn man

Ines

ein Projekt

Ines

startet. Und ich glaube, es ist auch nicht falsch,

Ines

zu sagen, okay, ich gehe das an, entweder

Ines

ja, ich hab ein

Ines

Open-Source-Projekt, ich möchte, ich sage Leuten,

Ines

hey, benutzt das. Das ist ja auch so eine Sache.

Ines

Okay, sagst du Leuten, mein Projekt ist geil,

Ines

benutzt das, ihr solltet da alles drauf aufbauen, oder

Ines

sagst du, oh, das ist nur so ein Nobby-Projekt,

Ines

ich hab meinen Code einfach veröffentlicht

Ines

und wenn jemand anders das nützlich findet,

Ines

benutze es gerne. Oder

Ines

dieses ein bisschen oldschooligere Modell, wir

Ines

bauen was zusammen.

Ines

Das sind so für mich die drei Arten

Ines

von Open-Source. Einmal, okay,

Ines

ich hab was gebaut, wenn jemand,

Ines

ich geb's dir umsonst, wenn du Lust hast,

Ines

vielleicht find's ja nützlich, oder wir

Ines

bauen als Community, entwickeln wir was

Ines

gemeinsam, oder wir

Ines

haben ein Produkt entwickelt und wir geben es euch umsonst.

Ines

Und

Ines

ich glaube, davon hängt es halt auch

Ines

ab, wie, ja, die Erwartungen,

Ines

die man als Nutzer haben sollte an das Projekt.

Ines

Und ich glaube, das wird halt auch oft nicht offen

Ines

kommuniziert. Und da,

Ines

das ist, wo viele der Missverständnis passieren,

Ines

wenn man

Ines

eben, ja, ein so ein persönliches

Ines

Projekt betrachtet, wie ein kommerzielles Projekt,

Ines

oder ein kommerzielles Projekt betrachtet,

Ines

wie so ein Community.

Ines

Oder wenn halt die Nutzer

Ines

oder die Maintainer gar nicht sicher sind,

Ines

was sie überhaupt sind.

Jochen

Das ist halt genau dann wahrscheinlich dieser

Jochen

Mismatch, dass dann die Nutzer denken, es ist ein

Jochen

Produkt, wo sie dann Support einfordern

Jochen

können und die Maintainer denken so,

Jochen

andere Leute haben Freizeit, warum

Jochen

habe ich eigentlich keine, warum sitze ich immer

Jochen

und muss irgendwie kostenlos Dienstleistungen

Jochen

für Leute machen,

Jochen

die mich gar nicht mehr bezahlen.

Ines

Von den Firmen oder von den Nutzern, das ist ja nicht unbedingt

Ines

immer der Respekt da, zu sagen, oh ja, das macht

Ines

jetzt jemand in seiner Freizeit.

Ines

Sondern, ja nö,

Ines

ich brauche Support. Und in

Ines

manchen Sachen, okay, wenn man halt Möglichkeiten

Ines

schafft, die Maintainer zu bezahlen,

Ines

kann das gut sein. Auch so GitHub hat ja GitHub-Sponsors

Ines

und es gibt andere Möglichkeiten.

Ines

Aber kann auch in manchen

Ines

Situationen problematisch sein, wenn du halt

Ines

vor allem, es geht ja nicht immer um diese

Ines

riesen Beträge. Wenn du jetzt ein kleiner Entwickler bist,

Ines

du sagst, hey, du hast so ein Hobbyprojekt, das hat auf einmal

Ines

ein bisschen an Popularität gewonnen,

Ines

das benutzen ein paar Firmen,

Ines

Und die zahlen dir jetzt 5 Euro im Monat. Davon wirst du nicht unbedingt reich und das zahlt dir jetzt auch nicht unbedingt die Zeit, die du da rein investierst. Aber auf einmal sind diese Firmen jetzt nicht nur irgendwelche nervigen User auf deinem Issue-Tracker, das sind jetzt deine Kunden quasi.

Ines

oder die fühlen sich zumindest so.

Ines

Ob das jemand hier Anforderungen stellen kann an dich,

Ines

weil du dir 5 Euro zahlst, ist eine andere Frage.

Ines

Aber die fühlen sich, als wären sie deine Kunden und sagen,

Ines

wenn du jetzt diesen Bug nicht fixst bis morgen,

Ines

dann ziehe ich aber hier meine Sponsorship zurück.

Ines

Das ist jetzt nicht so das Allheilmittel.

Ines

Das kann auch, glaube ich, durchaus Dinge noch komplizierter machen.

Ines

Also ich habe jetzt keine Lösung dafür.

Ines

Nö, es gibt wahrscheinlich keine Einfachlösung.

Ines

Ja.

Ines

Ich meine, eine Sache,

Ines

ich bin der Meinung, dass

Ines

Open Source

Ines

quasi

Ines

dass zum Beispiel

Ines

Open Source staatlich gefördert werden sollte.

Ines

Also zumindest, oder wenn wir in so einem System

Ines

sind wie in Deutschland, finde ich,

Ines

dass die Bundesregierung

Ines

sollte finanzielle Mittel

Ines

zur Verfügung stellen, die eben tatsächlich

Ines

in die Open-Source-Entwicklung

Ines

fließen soll oder wir sollten das,

Ines

wir sollten quasi Open-Source als

Ines

Common Good ansehen.

Dominik

Mit der Gießkanne oder kuratiert?

Dominik

Das ist halt

Ines

eine Frage, das Problem ist halt auch,

Ines

okay, momentan, wenn du dir das anguckst, okay, was

Ines

wird so entwickelt, wer bekommt Zuschläge

Ines

für die Entwicklung von was und wie funktioniert

Ines

das am Ende und wie sieht das denn aus?

Ines

Also ich

Ines

finde, ich glaube schon,

Ines

ich glaube,

Ines

eine Lösung, wo

Ines

da jemand sitzt, der weiß nicht, der

Ines

Open-Source-Minister sitzt und sich die Open-Source-Projekte

Ines

aussucht, finde ich auch problematisch.

Ines

Ich glaube nicht, dass das etwas ist, was

Ines

wir möchten.

Ines

Ich kann mir auch

Ines

momentan keinen Open-Source-Minister

Ines

vorstellen.

Ines

Es gibt nur sehr wenige

Ines

politisch aktive Menschen momentan,

Ines

die ich vorstellen könnte als Open-Source-Minister.

Ines

Anni, schau ja nicht in dieser Impftags-Force

Jochen

jetzt. Schade, der wäre doch gut geeignet

Jochen

Ja, ich denke mir jetzt vor, du hast

Ines

so ein Äquivalent von Horst Seehofer

Ines

als Open-Source-Minister.

Ines

Ich glaube, das wollen wir alle nicht.

Ines

Aber wie gesagt, ich habe

Ines

jetzt noch kein politisches Programm

Ines

ausgearbeitet, das ich hier präsentieren möchte,

Ines

aber ich glaube, das ist auf jeden Fall eine

Ines

Richtung, die ich

Jochen

sehen könnte. Ich weiß nicht, ich hätte mal

Jochen

überlegt, das wäre doch ziemlich

Jochen

einfach, dass zumindest

Jochen

mal die Anforderungen von irgendwelchen

Jochen

öffentlichen, größeren Projekten reinzuschreiben,

Jochen

das ist halt selbstverständlich, wenn das halt mit öffentlichen

Jochen

Mitteln finanziert wird, auch

Jochen

dann als Infrastruktur wieder zurück

Jochen

an die Öffentlichkeit geht, aber

Jochen

ja, keine Ahnung.

Ines

Ja, das würde ich auch unterstützen, vor allem

Ines

ja, aber ich meine, ich kann mir auch

Ines

gut vorstellen, warum die das nicht möchten,

Ines

aber...

Jochen

Ja, ja, klar, also dass die Auftragnehmer das nicht möchten,

Jochen

das kann ich mir auch gut vorstellen, aber es ist halt, ja...

Jochen

Ich meine, ich könnte mir auch vorstellen,

Ines

die jetzt vor manche dieser öffentlich finanzierten

Ines

Projekte, auch die man dann so

Ines

nur als Nutzer mal zu sehen

Ines

kriegt, wenn man mit denen interagiert.

Ines

Achso, ja.

Ines

Oder sowas jetzt zum Beispiel, auch selbst so eine App

Ines

oder irgendein Portal, irgendwas wird entwickelt,

Ines

da wird auch nicht viel Geld reingebracht und

Ines

okay, es gibt auf jeden Fall

Ines

ein Argument zu sagen, das sollte

Ines

Open Source sein, damit wir das auch

Ines

sehen können. Zumindest

Ines

jetzt nicht die ganze kritische Infrastruktur

Ines

oder so, aber grob

Ines

okay, wie funktioniert das? Was ist da

Ines

hinter?

Ines

Oder vielleicht ein paar Details.

Ines

Okay, wenn die jetzt irgendwelche Modelle trainieren,

Ines

dann wäre es schon gut,

Ines

ein bisschen mehr Informationen dazu zu haben,

Ines

was da jetzt reinfließt.

Ines

Und wer hat das gebaut?

Jochen

Sind da überhaupt diese ganzen Fragen,

Jochen

die man eigentlich mal berücksichtigen sollte,

Jochen

sind die denn berücksichtigt worden?

Jochen

Hat da sich jemand drüber nachgedacht?

Jochen

Ja, genau.

Jochen

Ja, wahrscheinlich nicht.

Ines

Und das wäre schon gut.

Ines

Aber ich glaube, es gäbe dann auch

Ines

so ein ganz neues neue Genre

Ines

an

Ines

Technikjournalisten,

Ines

die sich wahrscheinlich den ganzen Tag damit beschäftigen

Ines

könnten, die Open-Source-Projekte,

Ines

die staatlich geförderten Open-Source-Projekte

Ines

auseinanderzunehmen und zu analysieren.

Ines

Was ja auch nicht schlecht wäre.

Ines

Aber

Ines

es gibt halt, wenn man sich

Ines

Machine Learning anguckt, es gibt ja nicht wirklich

Ines

Standards,

Ines

die man da anbringen könnte. Und es ist ja auch

Ines

schwierig.

Ines

Und es gibt auch ja nix, was jemals,

Ines

es gibt ja wenige Dinge, die bisher überhaupt von einem Gericht mal getestet wurden.

Ines

Wenn es um auch so Themen, auch so Datensicherheit, bla,

Ines

oder was, wenn jetzt so ein Korpus an Trainingsdaten,

Ines

wenn der eine Lizenz hat, was bedeutet das für Modelle, die du trainierst?

Ines

Es gibt Modelle natürlich, wo du am Ende die Originaldaten rekonstruieren kannst.

Ines

Das ist, würde ich jetzt als Laie sagen, ein relativ klarer Fall.

Ines

okay, das geht natürlich nicht, wenn jetzt

Ines

die Daten nicht verfügbar sind.

Ines

Dann gibt es aber andere Sachen, wo du, okay, nur

Ines

wie abstrakt sollten

Ines

diese Gewichtungen sein, die du trainierst,

Ines

um halt das Argument

Ines

machen zu können, das repliziert

Ines

jetzt nicht unbedingt die

Ines

Originaldaten. Kann man das überhaupt sagen?

Ines

Ja, ja, das ist halt...

Ines

Wenn jetzt Instagram oder Facebook sagt,

Ines

oh, wir trainieren jetzt unsere Modelle

Ines

anhand von

Ines

Profilbildern unserer Nutzer. Geht das?

Ines

Geht das nicht? Können die das dann verwenden?

Ines

kannst du einfach das Internet scrapen

Ines

und dann dein

Ines

Modell veröffentlichen,

Ines

dass dann alle möglichen Firmen benutzen

Ines

und wenn irgendwas ist, wer ist schuld?

Ines

Du? Die Firmen?

Ines

Das sind alles Fragen, die

Ines

haben...

Ines

Da kann man sich drüber auslassen, ich bin, wie gesagt,

Ines

ich bin bleie,

Ines

ich hab da nur Meinungen oder Ideen zu,

Ines

aber auch da kommst du ja gar nicht drauf an.

Ines

Es ist am Ende, es gibt ja keine,

Ines

es gibt kaum

Ines

Entscheidungen dazu, es gibt kaum Fakten dazu,

Ines

Du musst halt gucken.

Ines

Naja, das wird noch eine ganze Zeit lang dauern,

Jochen

bis das einigermaßen...

Dominik

Bis das überhaupt jemand da irgendwo verstanden hat.

Dominik

Wahrscheinlich der...

Dominik

Selbst so diese...

Ines

So diese Trolley-Probleme von wegen

Ines

hier, okay, wer ist schuld, wenn das selbstfahrende

Ines

Auto einen Menschen überfährt? Das gab's ja schon.

Ines

So, wer ist da schuld?

Ines

Die Firma, die das Auto hergestellt

Ines

hat, die Person, der das Auto

Ines

gehört, der Entwickler,

Ines

der dieses Modell

Ines

trainiert hat,

Ines

die Person, die auf Mechanical Turk

Ines

für drei Dollar die Stunde

Ines

das falsch gelabelt hat.

Ines

Das falsch gelabelt hat.

Ines

Das sind auf jeden Fall

Ines

interessante Fragen.

Ines

Ich denke, der Weg

Ines

zu sinnvollen und

Ines

so

Jochen

Common Sense

Jochen

irgendwie Umgang damit im Alltag

Jochen

wird gepflastert sein mit einem Haufen

Jochen

Fehlentscheidungen, absurden Situationen und

Jochen

komischen

Jochen

Wie bei allem, ja.

Jochen

Wie bei allem, ja.

Jochen

Ja.

Jochen

Ja.

Dominik

Jetzt haben wir einen entspannenden Ausblick

Dominik

in die Zukunft.

Jochen

Ja, es ist alles

Jochen

nicht ganz schlecht.

Jochen

Es ist alles nicht super schön.

Jochen

Ja, ich finde solche Sachen sehr wertvoll.

Jochen

Schön, dass wir mal drüber geredet haben.

Jochen

Nein, wirklich, was du jetzt da geschrieben hast,

Dominik

ist etwas, was uns irgendwie weiterbringt.

Jochen

Es hilft dabei, so Gefühle

Jochen

zu kriegen, auf jeden Fall.

Jochen

Ich habe immer die Hoffnung,

Jochen

dass das irgendwann besser wird und nicht schlechter.

Jochen

Ja.

Jochen

Also objektiv betrachtet,

Jochen

Dinge werden ja besser.

Ines

Natürlich ist es immer, man hat das subjektive

Ines

Empfinden und es gibt natürlich andere Probleme.

Ines

Auch wenn du, okay, wenn du, der Gesellschaft es besser geht, auch dem Einzelnen geht es ja besser, wenn du so generell den Stand der Welt dir anschaust, sagst, okay, haben wir, wie viele Menschen haben wir, die unter der Armutsgrenze leben, aber natürlich ist das nicht die einzige Art und Weise, wie du sowas quantifizieren kannst.

Dominik

Ja, vor 100 Jahren haben die Leute Menschen noch im Zoo ausgestellt, das ist halt einfach, ja.

Ines

Ja, natürlich. Oder die Lebenserwartung, der generelle Lebensstandard ist natürlich besser, aber das heißt ja eben auch nicht, dass man sagen kann, ach ja, ist ja alles super, im Schnitt geht's allen besser. Oder du bist weniger arm als vorher, bist aber immer noch arm. Also ist ja nach wie vor ein Problem. Und wir denken uns auch immer neue Probleme aus.

Dominik

Ja, das eskaliert natürlich auch an einigen Stellen immer völlig. Da muss man gucken, dass man das irgendwie wieder einfangen kann oder so. Aber ja, also ich habe nicht das Gefühl, dass das schlechter wird. Das ist immer so punktuell, so ein Wabern und so. Aber vielleicht geht es ja durch solche Sachen halt in die richtige Richtung, dass man dadurch besser Wissen verteilen kann auch einfach. Weil ich glaube, so verteiltes Wissen ist vielleicht eine der Grundlagen von dem, was wir vielleicht mit Freiheit da meinten oder so. Ich weiß nicht, wovon wir die ganze Zeit geredet haben.

Jochen

Ich weiß nicht, ich glaube, es ist ganz schwer zu sagen, wird das jetzt irgendwie, hat das so eben so technische Fortschritte, haben die aus sich heraus schon so in sich emanzipatorisches Potenzial oder gehen sie doch dann nur dazu, dass Leute irgendwie noch reicher werden, die vorher schon relativ reich waren? Schwer. Also ich meine, was man vielleicht sagen kann, ist, dass in Zeiten, in denen sich viel ändert, gibt es halt auch mehr Chancen für Leute, die halt sozusagen was machen möchten.

Dominik

Ja, oder wir nehmen die Antwort, die wir immer geben können,

Dominik

it depends.

Dominik

Ja, stimmt.

Dominik

Ich meine, es stimmt natürlich,

Dominik

oder auch jetzt in der aktuellen Situation,

Dominik

wo auch Remote Work

Ines

normalisierter wird, wo es

Ines

vielleicht ein bisschen weniger,

Ines

schon immer war es durch das Internet,

Ines

das Internet hat es immer weniger relevant gemacht, wo man

Ines

denn gerade

Ines

physisch war, oder schon

Ines

allein die Tatsache, dass wir hier,

Ines

wir sitzen hier,

Ines

nehmen einen Podcast auf, ich bin in Australien,

Ines

ihr seid in Deutschland, es läuft.

Ines

Irgendjemand hört sich das an,

Ines

der ist was weiß ich wo und

Ines

das geht alles.

Ines

Und jetzt, okay, es wird weniger

Ines

wichtig, wo jemand arbeitet,

Ines

wo jemand

Ines

leben möchte. Ja, voll gut.

Ines

Das ist auf jeden Fall

Ines

theoretisch eine sehr positive

Ines

Entwicklung oder kann eine sehr positive Entwicklung

Ines

sein, wenn das entsprechend genutzt wird.

Ines

Ich finde, das ist ein

Dominik

sehr tolles Schlusswort, ehrlich gesagt.

Dominik

Nee, klingt gut.

Dominik

Egal, wo ihr uns also hört.

Dominik

Ob ihr nachts, tagsüber,

Dominik

morgens, mittags, abends

Dominik

im Flieger oder im Boot

Dominik

oder auf der Couch

Dominik

zum Einschlafen, hab ich auch schon gehört.

Jochen

Denkt daran, es ist der Fortschritt, der gerade durch eure

Jochen

Kopfhörer in euer

Jochen

Gehirn ausstrahlt. Ganz genau.

Dominik

Vielen Dank, Ines, dass du heute dabei warst.

Dominik

Ja, war sehr schön.

Dominik

Danke für die Einladung.

Dominik

Bleibt uns gewogen und schaltet wieder rein.

Dominik

Tschüss.