Další rána pro USA. DeepSeek používá čipy Huawei Ascend, které jsou speciálně navrženy na AI

DeepSeek R1 – nejnovější čínský model AI, který využívá čip Huawei AI. Nový model umělé inteligence se nyní dostal do centra pozornosti díky svým procesorům, a to uprostřed probíhající americko-čínské války o čipy a kontroly vývozu obchodních produktů.
DeepSeek je čínský startup v oblasti umělé inteligence založený v roce 2023. Vytváří open-source LLM (velké jazykové modely) a je výhradně založen čínským hedgeovým fondem High-flyer.
R1 je nejnovější inteligentní model umělé inteligence společnosti DeepSeek, který je nyní k dispozici uživatelům. Jedná se o univerzální systém umělé inteligence. Na rozdíl od OpenAI a dalších špičkových LLM je zdarma a pravděpodobně bez omezení. Startup spustil 10. ledna první bezplatnou aplikaci pro chatboty založenou na R1. Tato aplikace překonala OpenAI ChatGPT jako nejstahovanější aplikace v USA.
Na rozdíl od ostatních LLM je DeepSeek R1 mimořádně cenově výhodný. Na druhou stranu, Gemini, Claude Sonnet a ChatGPT zůstávají omezené pro uživatele v rámci předplatného. OpenAI o1 stojí 15 dolarů za milion vstupních tokenů, ale DeepSeek je za 0,55 dolaru.
Cenová efektivita, neomezené používání a vlastnosti open-source jsou hlavními znaky popularity DeepSeek R1. DeepSeek R1 nakonec ukazuje, že člověk nemusí utrácet tisíce dolarů, aby měl přístup k modelům AI pro neomezené použití.
Čipy DeepSeek R1
Ano, ještě zajímavější je, že DeepSeek R1 běží na čipech Huawei Ascend 910C. Čínský model skutečně využívá k trénování procesory Nvidia. Jeho odvozování je však založeno na čipové sadě Ascend. Pochopme tedy, v čem je rozdíl.
Ve světě umělé inteligence se tréninkem rozumí proces učení modelu umělé inteligence o plnění úkolů. V rámci tohoto postupu je model osazen sadou tréninkových dat. Učí se vzor a podrobnosti těchto dat, aby se podle nich mohl rozhodovat.
Inference je však proces, při kterém se k předpovědím používá natrénovaný LLM. Při tomto postupu je natrénovaný model zásoben novými daty a požádán, aby učinil rozhodnutí bez příkladů požadovaného výsledku. Zjednodušeně řečeno, použije naučené vzory k vytvoření obsahu nebo k rozhodování o zadaném příkazu.
DeepSeek R1 používá čip Huawei AI?
Vypadá to, že velkou roli v popularitě DeepSeek R1 hraje společnost Huawei. Podle dorialexandera používá DeepSeek R1 k odvozování informací čipy Huawei Ascend 910C. Model byl vycvičen na procesoru Nvidia H800, ale inferenci provádí na procesoru Huawei Ascend 910C.
Ascend 910C je nová čipová sada Huawei pro umělou inteligenci. Společnost tento procesor v tichosti představila v loňském roce. Je přímou alternativou k Nvidia H100 a tvrdí, že do jisté míry poráží Nvidia B20. Čip je tedy výkonnější než jeho předchůdci.
Na druhou stranu má čip Ascend 910C ve srovnání s mnoha procesory Nvidia slušnou cenu. Zdá se tedy, že procesory Huawei AI jsou pro model DeepSeek R1 AI správnou volbou. Další podrobnosti o novém modelu R1 zatím nejsou známy, ale mlha se brzy vyjasní.
Autor: Lukáš Drahozal
Zdroj: techpowerup.com, tomshardware.com