En række spørgsmål om modellen og jeres planer #297
mindplay-dk
started this conversation in
General
Replies: 1 comment 4 replies
-
|
Hej, tak for interessen. Jeg skal prøve at besvare dine spørgsmål kort.
Håber det svarede nogenlunde på dine spørgsmål. |
Beta Was this translation helpful? Give feedback.
4 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
Hej,
Jeg har lige prøvet at køre modellen (
danish-foundation-models/munin-7b-alpha-Q8_0-GGUF) og vil blot sige, at jeg synes den er overraskende velformuleret på dansk!Jeg har afprøvet en del af de populære "små" modeller, og de laver alle samme grammatiske fejl (f.eks. en/et) og middelmådige formuleringer i det hele taget - modellen her virker umiddelbart meget bedre til dansk. (Den eneste model jeg har set der måske er bedre, er ChatGPT.)
Jeg er blot bruger af LLMs - har bygget nogen agentiske workflows osv... min forståelse af detaljerne er overfladisk. 😅
Jeg har en del spørgsmål:
Er der nogen udsigt til en instruktions-trænet model der vil kunne bruges i workflows på dansk?
Er der nogen planer om en større model?
Findes der i det hele taget tilstrækkelige mængder dansk indhold til at træne en større model?
Eller hvorfor findes der ikke en åben model på dansk endnu?
Hvis der ikke findes tilstrækkeligt indhold, kunne man forestille sig at lave en mindre model, som er god nok til, at den kan oversætte fra engelsk - så man kunne lave et større syntetisk datasæt på dansk?
Er der nogen planer om at træne en base model på dansk og engelsk?
Jeg tænker, at der er jo meget indhold, som kun findes på engelsk - og sprogmodeller har, så vidt jeg forstår, evnen til at abstrahere (i nogen grad) fra sprog?
Dansk i det hele taget er i stigende grad fyldt med engelske ord og udtryk - måske en to-sproget model vil opnå en bedre forståelse for de ord og koncepter, vi låner fra engelsk?
Sprog opgaver i det hele taget kræver ofte et to-sproget model - f.eks. er mange jobopslag i Danmark på engelsk, og vi har mange brugere i Danmark, der kun taler engelsk. Mon ikke en to-sproget model ville have flere anvendelser?
Håber nogen har lyst til at svare på nogen af alle mine spørgsmål. 😅
Jeg har fulgt udviklingen af LLM tæt fra starten og undrer mig fortsat over, at vi skal hænge på en Amerikansk virksomhed's tjeneste for at få en LLM der kan begå sig bare nogenlunde på Dansk. Jeg har et par ideer til nogen projekter, der bl.a. af data privacy (og etiske) hensyn nok ikke burde udvikles med en stor Amerikansk virksomhed som data ansvarlig og tjeneste udbyder.☺️
Men fedt at se, at ét eller andet rør sig på den front! 😄
Beta Was this translation helpful? Give feedback.
All reactions