Er is in de kranten en op social media de afgelopen tijd veel ophef geweest over ChatGPT[i]. Zo werd door verschillende journalisten de verwachting uitgesproken dat ChatGPT het werk van journalisten, advocaten en andere kenniswerkers wel eens overbodig zou kunnen maken of in ieder geval fundamenteel zou kunnen veranderen[ii]. Voortaan zou je je juridische vragen gewoon kunnen voorleggen aan ChatGPT en doordat dit programma toegang heeft tot de oneindige bronnen van het internet zou je een veel beter antwoord kunnen krijgen dan een advocaat kan geven. Het ABB maakte zich daardoor zorgen om de toekomst van de advocatuur en besloot zich in ChatGPT te verdiepen en het te testen. Zijn onze dagen als advocaat inderdaad geteld?  

Tekst: Diederik Palstra

ChatGPT is een programma dat door middel van kunstmatige intelligentie teksten genereert. Je kunt een opdracht of vraag intypen en ChatGPT levert dan vervolgens in korte tijd de gevraagde tekst of het antwoord op de gestelde vraag. En dat dan ook nog eens in de taal waarin de vraag of opdracht werd gesteld. Er is geen sprake van plagiaat door ChatGPT. De geformuleerde tekst is een originele tekst en niet ergens van het internet gekopieerd. Veel studenten en scholieren maken bij het schrijven van essays dan ook al dankbaar gebruik van deze tool. Dat gebeurt zelfs in een dusdanige mate dat studenten in Australië hun examens weer met pen en papier moeten schrijven.

ChatGPT werd ontwikkeld door OpenAI, een bedrijf dat in 2015 in de VS werd opgericht door een groep investeerders, waaronder Elon Musk en de huidige ceo Sam Altman. Het was in het begin een non-profit organisatie maar inmiddels verkoopt het ook licenties voor ChatGPT aan bedrijven, zoals recent bijvoorbeeld aan Microsoft voor diens Bing zoekmachine.

300 miljard woorden

ChatGPT is gebaseerd op een reusachtige database met informatie die afkomstig is van het internet, waaronder 570 GB aan boeken, websites, Wikipedia-artikelen, etcetera. In totaal zijn 300 miljard woorden ingevoerd in ChatGPT. Het werkt op basis van een algoritme dat aan de hand van de woorden die er al staan, telkens het volgende woord kan voorspellen. Dit gebeurt op basis van patronen die ChatGPT in de database herkent en niet omdat het de gestelde vraag begrijpt. Het kopieert de teksten uit de database niet, maar reconstrueert het telkens tot een nieuwe tekst. Het feit dat nieuwe data steeds moet worden ingevoerd in ChatGPT en daarna moet worden getest, betekent wel dat het achterloopt. Het houdt bijvoorbeeld nog geen rekening met gebeurtenissen na 2021.

Chatbots bestaan al veel langer. Het Advocatenblad besteedde hier al aandacht aan in een artikel in 2018[iii]. Chatbots werden toen voorspeld als de trend van 2018. In het artikel in het Advocatenblad werd gememoreerd dat de eerste chatbot, Eliza, zelfs al uit 1964 stamt[iv]. Daar was echter nog geen gesprek mee te voeren. Dat kan nu wel. Nog nooit eerder werkte een chatbot zo goed als ChatGPT. Vandaar dus alle ophef. Er zijn wel verschillende gevaren aan het gebruik van ChatGPT.

Bronvermelding ontbreekt

Zo is een gevaar van ChatGPT dat we niet weten uit welke bronnen de antwoorden afkomstig zijn, want het doet niet aan bronvermelding. We kunnen de betrouwbaarheid van het antwoord dus niet toetsen. Er is ook al gebleken dat ChatGPT behoorlijke fouten kan maken. Elke tekst moet dus altijd goed worden nagekeken. Toch heeft ChatGPT al verschillende successen geboekt. Zo is het voor vier juridische vakken geslaagd aan de University of Minnesota en ook voor een examen aan de Wharton Business School van de University of Pennsylvania – zij het in beide gevallen niet met klinkende cijfers[v].

Het ABB wilde dit ook eens testen met betrekking tot examens van een Nederlandse juridische faculteit. Ik liet ChatGPT daarom een multiple choice tentamen Inleiding Recht maken van de UvA dat ik op internet vond. De resultaten waren vergelijkbaar met die van de Amerikaanse examens. Van de 50 voorgelegde vragen had ChatGPT er 30 goed (en dus 20 fout). ChatGPT zou daarmee het tentamen met de hakken over de sloot hebben gehaald. Een voorbeeld van een correct antwoord van ChatGPT op een tentamenvraag kunt u hieronder lezen.

“Vraag 18

In lid 2 van artikel 6:162 BW staat: ‘als onrechtmatige daad worden aangemerkt een inbreuk op een recht en een doen of nalaten in strijd met een wettelijke plicht of met hetgeen volgens ongeschreven recht in het maatschappelijk verkeer betaamt ́. Welke baanbrekende uitspraak is in het onderstreepte deel te herkennen?

  1. Zutphense Waterleiding
  2. Melk en Water
  3. Lindenbaum/Cohen.”

Antwoord ChatGPT:

“De baanbrekende uitspraak die in het onderstreepte deel van lid 2 van artikel 6:162 BW te herkennen is, is de uitspraak in de zaak Lindenbaum/Cohen. In deze zaak bepaalde de Hoge Raad dat het begrip ‘onrechtmatige daad’ niet alleen betrekking heeft op inbreuken op rechten, maar ook op handelen in strijd met hetgeen volgens ongeschreven recht in het maatschappelijk verkeer betaamt. Dit betekende een uitbreiding van de reikwijdte van de onrechtmatige daad en had grote invloed op het Nederlandse aansprakelijkheidsrecht.”

Met het halen van een tentamen Inleiding recht ben je er echter uiteraard nog niet. Daarvoor moet een hele rechtenstudie worden afgerond. En de tentamens worden steeds moeilijker nadat je verder vordert in de studie. Bovendien zijn vragen uit de praktijk in het algemeen toch moeilijker te beantwoorden. Om die reden dacht ik er goed aan te doen ChatGPT ook eens een vraag uit een Grotius opdracht voor te leggen. Ook dat ging echter helemaal niet zo slecht, zoals blijkt uit het onderstaande antwoord.

Grotius vraag: Zet in eigen woorden uiteen hoe de uitspraken van de Hoge Raad inzake Wessanen/Nutricia (HR 17 september 2004, NJ 2005, 169) en Lundiform/Mexx (HR 5 april 2013 JOR 2013, 198) past binnen de lijn van de jurisprudentie die de Hoge Raad ten aanzien van de interpretatie van commerciële overeenkomsten heeft ontwikkeld. Bespreek daarbij kort de omstandigheden die de Nederlandse rechter heeft geïdentificeerd die ertoe kunnen leiden dat in voorkomend geval beslissende betekenis wordt toegekend aan de taalkundige uitleg van een contractuele bepaling.”

Antwoord ChatGPT:

“De uitspraken van de Hoge Raad inzake Wessanen/Nutricia en Lundiform/Mexx passen binnen de lijn van de jurisprudentie die de Hoge Raad heeft ontwikkeld met betrekking tot de interpretatie van commerciële overeenkomsten. Volgens deze lijn van jurisprudentie moet bij de uitleg van commerciële overeenkomsten in beginsel worden gekeken naar de taalkundige betekenis van de bewoordingen van de overeenkomst. Dit betekent dat de bedoeling van partijen niet altijd doorslaggevend is, tenzij uit de overeenkomst en de omstandigheden van het geval blijkt dat partijen een andere betekenis aan de bewoordingen hebben gegeven dan de taalkundige betekenis.

In de zaak Wessanen/Nutricia ging het om de uitleg van een non-concurrentiebeding in een overnameovereenkomst. De Hoge Raad oordeelde dat de bewoordingen van het nonconcurrentiebeding duidelijk en ondubbelzinnig waren en dat er geen aanleiding was om van de taalkundige betekenis af te wijken.

In de zaak Lundiform/Mexx ging het om de uitleg van een franchiseovereenkomst. De Hoge Raad oordeelde dat de taalkundige betekenis van de bewoordingen van de overeenkomst weliswaar belangrijk was, maar dat ook andere omstandigheden zoals de aard van de overeenkomst, de omvang van de franchiseformule en de rechtszekerheid een rol speelden bij de uitleg van de overeenkomst.

De omstandigheden die de Nederlandse rechter heeft geïdentificeerd die kunnen leiden tot beslissende betekenis van de taalkundige uitleg van een contractuele bepaling zijn onder meer de duidelijkheid en precisie van de bewoordingen van de overeenkomst, het feit dat partijen bijgestaan zijn door deskundige adviseurs, de aard van de overeenkomst en de context waarin de overeenkomst is gesloten. Als de bewoordingen van de overeenkomst duidelijk en ondubbelzinnig zijn en er geen andere omstandigheden zijn die tot een afwijkende uitleg leiden, dan zal de taalkundige betekenis van de overeenkomst doorslaggevend zijn bij de interpretatie ervan.

Ik had daarbij wel de indruk dat casus vragen uit de Grotiusopdrachten voor meer moeilijkheden zorgden dan essayvragen.

Dan maar een echte vraag uit de praktijk. Mijn praktijk bestaat uit het structureren van beleggingsfondsen. Vandaar de volgende vraag aan ChatGPT om te kijken of ik zelf voor mijn baan moet vrezen:

Vraag: Welke rechtsvorm is het meest geschikt voor een private equity fonds?

Antwoord ChatGPT:

“Er zijn verschillende rechtsvormen die geschikt kunnen zijn voor een private equity fonds, afhankelijk van de specifieke situatie en eisen van het fonds. Een veelgebruikte rechtsvorm voor private equity fondsen is een limited partnership, omdat dit een flexibele structuur biedt waarbij de general partner verantwoordelijk is voor de dagelijkse leiding van het fonds en de limited partners alleen aansprakelijk zijn voor hun geïnvesteerde bedrag. Een andere veelgebruikte rechtsvorm is een commanditaire vennootschap (CV). Een besloten vennootschap met beperkte aansprakelijkheid (BV) is ook een optie, maar is minder vaak gebruikt voor private equity fondsen.”

Dit is toch wel een erg elementair antwoord. Er spelen drie elementen een rol bij het structureren van een private equity fonds: fiscaal recht, financieel recht en ondernemingsrecht. Daar wordt hier grotendeels aan voorbij gegaan. Bovendien gaat ChatGPT ook enigszins de mist in omdat een limited partnership en een commanditaire vennootschap dezelfde rechtsvorm zijn. Bovendien ontbreekt de coöperatie die vaak gebruikt wordt als rechtsvorm voor een private equity fonds.

Hierdoor toch enigszins gerustgesteld heb ik ChatGPT zelf ook maar eens de vraag voorgelegd of ChatGPT advocaten in de toekomst overbodig zal maken. Ik kreeg het volgende diplomatieke antwoord:

“Het is onwaarschijnlijk dat ChatGPT advocaten volledig overbodig zal maken in de toekomst.

Hoewel ChatGPT in staat is om informatie te verstrekken en bepaalde taken uit te voeren die normaal gesproken door advocaten worden uitgevoerd, zijn er nog steeds veel situaties waarin de expertise en menselijke beoordeling van een advocaat noodzakelijk zijn.

Advocaten kunnen bijvoorbeeld emotionele steun bieden aan hun cliënten, strategisch advies geven en pleiten voor hun zaak in de rechtszaal. ChatGPT kan nuttig zijn als aanvulling op de diensten van advocaten, maar het zal waarschijnlijk geen volledige vervanging zijn.”

Volledig overbodig worden we dus gelukkig waarschijnlijk niet.

Noten:

[i] Zo noemde Ernst-Jan Pfauth het een dag voor in de geschiedenisboeken en het einde van Google. NRC 11 december 2022, “Het einde van Google”. Overigens heeft Google inmiddels ook een chatbot op de markt gebracht genaamd Bard.

[ii] Elisa Hulstaert: “De gevaren van ChatGPT: ‘We dreigen collectief dommer te worden”; Knack 23 januari 2023. Alex Hughes: “ChatGPT; Everything you need to know about OpenAI’s GPT-3 Tool”; Science Focus 2 februari 2023.

[iii] Nathalie Gloudemans-Voogd: “De kracht van chatbots”; Advocatenblad 2018-3, 5 april 2018.

[iv] Allen & Overy heeft recent ook een legal chatbot genaamd Harvey geïntroduceerd voor het opstellen van contracten en memo’s voor cliënten, zo blijkt uit een artikel in de Financial Times van 15 februari 2023: “Allen & Overy introduces AI chatbot to lawyers in search of efficiencies”.

[v] Samantha Murphy Kelly: “ChatGPT passes exams from law and business schools”; CNN, 26 januari 2023.