2025-04-25
"Durante o Festival da Primavera, quase 100 instituições de investimento pediram às pessoas que as apresentassem para ver se havia uma oportunidade de investir na DeepSeek".
Diante do fenômeno da DeepSeek, um grande modelo lançado por empresas domésticas de IA, um investidor anjo admitiu ao repórter da Surging News,"Precisamos de pensar porque é que projetos como o DeepSeek foram previamente ignorados por nós. "
O boom da tecnologia DeepSeek provocou um choque global, os preços das ações de muitos gigantes da tecnologia do outro lado do oceano despencaram, e a líder da inteligência artificial Nvidia caiu 4.3 trilhões de yuans em valor de mercado durante a noite.
"A DeepSeek não tem um orçamento promocional, nem um salário anual de 10 milhões de pessoas, é um objetivo claro investir em pesquisa e lançamento de produtos".Outro grande modelo de unicórnio disse aos repórteres que "o fundador da DeepSeek, Liang Wenfeng, é uma pessoa com crenças em IA, e o romantismo técnico que ele insiste é muito conhecido na indústria".
"Não perca o próximo DeepSeek porque você segue DeepSeek, o que precisamos não é uma pressa para perseguir e imitar, a era da inteligência artificial forçará os seres humanos a retornar à fonte de valor." Professor da Faculdade de Ciências da Computação e Tecnologia da Universidade de Fudan, disse Xiao Yanghua, diretor de ciência de dados do Laboratório de Chave de Xangai, a repórteres.
Na sua opinião, por trás da ascensão do DeepSeek está a personificação do poder da IA da China, e um grupo de startups de inteligência artificial semelhantes ao DeepSeek estão no palco mundial.
Por que a DeepSeek avançou
"O DeepSeek estava fora do meu alcance no ano passado, agora está fora do meu alcance".disse Surging repórteres de notícias com um sorriso que como um graduado de algoritmo de uma universidade doméstica superior, ele recebeu um ramo de oliveira da DeepSeek no ano passado, mas finalmente desistiu porque ele estava preocupado que a empresa não fosse conhecida o suficiente e não se concentraria na IA.
Nas redes sociais, muitos recém-formados mostraram o convite de emprego da DeepSeek, e as palavras são bastante lamentáveis.
Também "falta" DeepSeek há um círculo de instituições de investimento, "os executivos da empresa DeepSeek claramente não estão interessados em comercialização, apenas querem fazer pesquisa técnica." As instituições de investimento precisam de comercializar a empresa"A empresa não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio, não tem um capital próprio.Nenhum profissional de investimento em IA não conhece o DeepSeek, e algumas pessoas estenderam um ramo de oliveira antes da explosão.
Mas o resultado final é que nenhuma VC (empresa de capital de risco) investiu com sucesso na empresa.
Algumas pessoas que conhecem a DeepSeek disseram a repórteres que tinham entrevistado alguns talentos no campo da IA, e finalmente rejeitaram a sua própria empresa e foram para a DeepSeek,Na base de que eles tinham uma boa atmosfera de pesquisa científica e eram uma equipe que realmente fez coisas.
"Em termos de salário, a DeepSeek está apenas no meio da indústria, não no mais alto". Ele admitiu: "A densidade de talentos pode não ser tão boa quanto a do chefe da grande fábrica,Não é que as pessoas na grande fábrica não sejam espertas."As grandes empresas pagam bem, mas as suas lutas internas são ferozes,E o desejo de focar na tecnologia não é tão puro como uma empresa de tecnologia como a DeepSeek. "
"A popularidade do DeepSeek foi devido ao acaso, mas mais à necessidade", disse Xiao Yanghua a repórteres.
"A empresa-mãe por trás dele, a Magic Capital, tem forte força técnica e poder de computação no campo da negociação quantitativa e finanças inteligentes.Quando o OpenAI lançou o ChatGPT, havia poucos aglomerados domésticos de Wanka, exceto Magic Square.A convergência de um grande número de talentos relacionados com IA no campo financeiro também dá à DeepSeek uma grande vantagem de talentos. "
"É mais sobre a mudança de mentalidade". Xiao Yanghua admitiu que a maioria das empresas de IA no passado estavam ansiosas para alcançar o sucesso, ocupadas com lista de pincel, publicidade, realização e contabilidade de capital,Enquanto o DeepSeek estava calmo e focado na exploração técnicaEm termos de fatores ambientais, Hangzhou, onde a DeepSeek está localizada, é a maior cidade da China.Tem um ambiente de inovação avançadoO governo criou uma atmosfera de tolerância, tentativa e erro e exploração, e apenas construiu plataformas sem interferir na direção de inovação das empresas,que é muito propício ao desenvolvimento das empresas.
Tan Jian, professor associado de design de interação inteligente na Universidade de Correios e Telecomunicações de Pequim, acredita que as principais mudanças trazidas pelo DeepSeek significam que,à medida que o custo do modelo diminui, no futuro, as aplicações de IA de alto nível serão promovidas pelas pequenas e médias empresas e formarão uma situação de "cento flores", e a curto e médio prazo, a computação em nuvem,computação de borda"Atualmente, as três principais operadoras e muitas plataformas de serviços de computação da Internet se conectaram ao DeepSeek e forneceram acesso à Internet.e pode-se prever que a receita destes serviços tradicionais de nuvem e plataformas de computação irá aumentar constantemente como toda a população registra serviços de IA. "
O DeepSeek não é o único chinês
A explosão do DeepSeek também deixa o mundo exterior ver que a China formou uma série de empresas poderosas e influentes na grande indústria de modelos, incluindo a ByteDance, Ali,Tencent e outras grandes fábricas, e há startups como o Lado Negro da Lua, Wisdom Spectrum e MiniMax.
No primeiro dia do Ano Novo, depois do DeepSeek ter atingido toda a rede, a equipa Ali Yuntongyi lançou o seu modelo principal "Qwen2.5-Max",tornando-se o segundo modelo chinês de grande linguagem que pode igualar a série O1 da empresa OpenAI nos Estados Unidos, o que mais uma vez causou um choque.
De acordo com a classificação da plataforma de terceiros, "Qwen2.5-Max" ficou em 7o lugar na lista geral com 1332 pontos, superando a pesquisa profunda "DeepSeek-V3" e o "o1-mini" da OpenAI.Em matemática e programação, "Qwen2.5-Max" ficou em primeiro e segundo lugar em Hard Prompts.
O unicórnio de IA "O Lado Negro da Lua" foi criado em abril de 2023, e seu representante legal Yang Zhilin se formou na Universidade de Tsinghua.Ele obteve um doutorado na Universidade Carnegie Mellon nos Estados Unidos e começou seu próprio negócio em Pequim.De acordo com dados de terceiros, em janeiro, a avaliação da empresa no lado negro do mês atingiu US$ 3,3 bilhões.
MiniMax, um unicórnio de IA com sede em Xangai, foi fundado em dezembro de 2021 com grandes modelos multimodal de texto, voz, música, imagens e vídeo.Um destaque digno de nota é que o MiniMax está na vanguarda do país em termos de IA indo para o marOs dados mais recentes mostram que a versão internacional do Conch AI da MiniMax liderou a lista global de vídeos de IA em dezembro do ano passado, com mais de 27 milhões de visitas mensais.
Liu Hua disse anteriormente a repórteres de notícias que os Estados Unidos estão em uma posição de liderança na tecnologia de grandes modelos de IA como um todo, e em voz, vídeo e outros segmentos,A velocidade de recuperação dos grandes modelos da China é rápidaOs Estados Unidos utilizam amplamente sistemas como a IA de concha e o grande modelo de Kuaishou e, atualmente, neste domínio, o nível técnico dos dois países atingiu um nível de igualdade.
"Na verdade, a taxa de iteração e evolução de tecnologias de grandes modelos nos Estados Unidos hoje é realmente mais lenta do que antes". Liu Hua disse, "Atualmente,As empresas líderes nos Estados Unidos têm ou estão a construir 100A realização do cluster de um milhão de cartões enfrenta muitos desafios.Dentre os quais se o apoio às instalações de energia em grande escala local é um dos factores-chave. "
Em um cenário como este, as empresas chinesas estão rapidamente alcançando seus rivais americanos.
"O grande campo de modelos ainda não formou um fosso absoluto, a indústria ainda está no estágio inicial de desenvolvimento, e ainda há um longo caminho a percorrer desde o estágio maduro". Chen Cheng,um veterano observador da indústria da IA, disse aos repórteres da Surging News que ele adivinhou que a concorrência e o volume interno na indústria de grandes modelos seriam ainda mais intensificados após a explosão da DeepSeek.
"A concorrência acirrada entre fabricantes, o maior benefício é, sem dúvida, o utilizador do grande modelo, ou seja, o utilizador comum,Desfrutarão da evolução contínua da capacidade do grande modelo, a melhoria contínua do custo do dividendo".
Uma empresa de IA bem conhecida disse aos repórteres que o DeepSeek não é perfeito, modelo v3 principalmente em matemática e código e outras capacidades são mais proeminentes, outras geração de texto de classe geral,A compreensão e outros efeitos têm espaço para melhorarO custo de formação publicado da v3 é de cerca de 5,576 milhões de dólares.576 milhões, o valor refere-se principalmente ao custo da GPU para o pré-treino do modelo, e não inclui outros custos importantes, tais como P&D, recolha de dados e limpeza.)
"Depois da explosão da DeepSeek, sem dúvida, estimulará todas as partes da indústria a investir mais na concorrência tecnológica benigna,que é extremamente benéfico para o desenvolvimento de toda a indústria"Atualmente, no grande circuito de modelos, as empresas estão a trabalhar arduamente para alcançar um melhor desempenho, e este ambiente competitivo dinâmico é muito raro." Outro iniciante de IA admitiu aos repórteres que " nesta fase, quem vai ficar para trás e quem pode se destacar ainda são desconhecidos.e toda a indústria está cheia de vitalidade e potencial de desenvolvimento. "
Como funciona o efeito DeepSeek?
Hu Yanping, especialista-chefe do FutureLabs FutureLab, disse que o DeepSeek tornou-se um efeito, incluindo quatro aspectos, a saber, o efeito custo do poder de computação, o efeito detonador do usuário,o efeito de reforço da confiança e o efeito ecológico do código aberto"Em seguida, haverá um novo fenômeno, muitas empresas ligadas ligeiramente fortes serão baseadas na base do grande modelo para fazer uma variedade de pós-formação, destilação de ajuste fino,combinado com a base de conhecimentos, etc., e depois enfrentar milhares de indústrias, formando uma grande indústria modelo na era da IA 2.0 da parte de trás do mercado".
Com base nessa observação, Hu Yanping acredita que a indústria de IA tem três direções potenciais a seguir: a primeira direção é o fim do primeiro ciclo da IA 2.0 representado pelo modelo de linguagem grande, e o segundo ciclo representado pela inteligência multimodal, incorporada, inteligência espaço-tempo, etc.; A segunda direcção é o mercado pós-venda de grandes modelos de IA, ou seja,a emergência ecológica da cintura e da cauda longaA terceira direcção são os agentes de IA de ponta a ponta, especialmente aqueles que podem ser integrados com os fluxos de trabalho e as necessidades individuais.
Na opinião de Xiao Yanghua, muitas startups de IA têm uma boa formação universitária, e não há escassez de talento e fundos, mas há um problema geral de ansiedade mental, ansiedade demais,Mas não conduz à inovação original.
"As empresas precisam de uma atmosfera de desenvolvimento mais descontraída e de se desenvolverem de forma constante de acordo com o seu próprio ritmo e direcção estratégica".Os governos de todo o mundo estão agora muito preocupados com as empresas de IA, mas a falta de empresas verdadeiramente excelentes, tirar de mãos, "a preocupação do governo deve ser moderada, depois de construir um bom ambiente e plataforma, não haverá mais intervenção."Preocupar-se demais pode perturbar o ritmo dos negóciosÉ mais importante ser um cuidador inteligente".
Além disso, o surgimento do DeepSeek, provou que as empresas de IA contam com a queima de dinheiro volume "fluxo de investimento" "customer caminho não é viável,O passado chinês IA grande modelo "volume" poder de computação, "volume" preço, "volume" cliente, "volume" capacidade de liquidez, agora as pessoas mais reconhecer a inovação original de longo prazo,As empresas devem pensar na inovação estrutural e na investigação e desenvolvimento de baixo custoEm vez de queimar dinheiro.
"Os grandes modelos de IA são uma via de investimento muito arriscada com grandes quantidades de dinheiro, e apenas algumas empresas sobreviverão, o que significa que muitos investimentos em empresas falharão." O vice-presidente de uma grande empresa modelo disse ao repórter da Surging News que no ambiente atual, o fundo de dólar dos EUA não pode alcançar o caminho tradicional de "investimento e retirada do tubo financeiro" por causa da razão da limitação da captação de fundos, "a grande indústria de modelos deve aceitar uma realidade,E o governo vai guiar a fundação a desempenhar um papel mais importante. "
De um ponto de vista formal, ele sugeriu que você pode se referir aos atuais cupons de poder de computação doméstico e internacional.Agora as empresas estatais podem estabelecer um cluster de poder de computação para fornecer poder de computação para grandes empresas modelo, e após o investimento, a maior parte dos fundos de investimento será devolvida às empresas estatais sob a forma de taxas de locação de energia de computação.
Xiao Yanghua believes that the wave of entrepreneurship set off by the large model industry means that private enterprises and small and micro enterprises play an important role in the national science and technology innovation system"As empresas são muitas vezes as mais curiosas e criativas na fase de arranque e na fase de micro e pequenas empresas.É tão precioso que toda a sociedade deve cuidar bem dele para que as sementes da inovação possam continuar a enraizar e a crescer no solo certo.. "
Envie a sua consulta directamente para nós