
I found DeepSeek v3 announcement interesting as it seems to show an alternative way to compete in building LLM, as it seems to be significantly lower cost than all the other popular models.
I had kind of written off LLMs as an investment area for normal venture funds due to capital requirements, but this shows there is possibly another less cost intensive way. That is if the founder can assemble a great AI team, which might not be possible with normal funding.
It also shows that founders and startups can find new ways and be disruptive (a’la Innovator’s Dilemma) more often than one would reasonably think.
Vet vi att deras uppgifter stämmer? Det är trots allt en kinesisk startup med allt vad det innebär.
Funderade själv på att börja använda dem i mina projekt men känns för osäkert givet kinesisk lagstiftning.
Menar du innehållet eller kostnaden för att träna modellen? Jag tycker det är kostnaden som är intressantast om det kan dupliceras av andra.
Både och 🙂 Om man är lite paranoid kan man ju tänka sig att kinesiska staten hjälpt dem på olika sätt med finansiering och själva modellen är tydligt tränad för att bete sig enligt regimens önskan. Skulle vara väldigt försiktigt att köra något känsligt med den, även om en lokalt hostad modell antagligen är betydligt säkrare. Vet du mer i detalj hur den har fansierats?
Vet inte i detalj, ska ha börjat som en del av en kinesisk hedgefond (eller liknande). Att köra känsligt material hos extern LLM ska man väl alltid vara försiktig med iofs.
Testa t.ex. att fråga den om Tiananmen Square 🙂 Den är en lydig kinesisk medborgare