首頁 分類 排行榜 閱讀記錄 我的書架

第285章 MiniMax:團隊、產品、創始人,還有和豆包的真實關係

2026-02-22 作者:巴蜀魔幻俠

提起AI圈的“後起之秀”,MiniMax絕對是繞不開的名字。很多人可能用過它的Glow、海螺AI,也聽過它和抖音旗下豆包的各種傳聞,但對它到底是誰、背後團隊有多牛、產品能幹嘛,還有和豆包到底啥關係,一直雲裡霧裡。今天就用最接地氣的大白話,把這些問題拆解開講透,保證不管你是AI小白還是普通使用者,都能一看就懂。

一、先搞懂MiniMax:AI圈的“實幹派獨角獸”年才成立卻衝得飛快

首先得明確一點,MiniMax不是甚麼小作坊,而是正兒八經的AI巨頭種子選手。用一句話總結年底在上海成立的AI創業公司,專門搞“能聽、能看、能說、能做”的多模態大模型,短短几年就做到了行業頂尖,還成功上市了。

1. 團隊底子:400人精英戰隊,不搞花架子只拼技術

MiniMax的團隊規模不算特別大,大概400人左右,但“含金量”超高。和很多AI公司喜歡挖行業老人不同,它的人才主要靠校招自己培養,簡單說就是“從一張白紙開始,培養最貼合自己技術路線的人”。

這裡有個很有意思的點:團隊沒有KPI考核。咱們普通人上班都要面對業績壓力,但MiniMax不一樣,他們靠“單一目標拆解”驅動——比如今年要把影片生成模型做到全球前三,所有人就圍繞這個目標分工幹活,不用天天盯著KPI報表。這種模式雖然少見,但效果很明顯:團隊凝聚力強,技術迭代速度特別快,從成立到釋出全球頂尖的大模型,只用了不到4年時間。

而且公司的定位很清晰:聚焦“多模態AGI”。可能有人聽不懂“多模態AGI”,其實翻譯過來就是“全能型人工智慧”——不只是能處理文字,還能搞定語音、圖片、影片,甚至能和物理世界互動,比如以後可能賦能機器人,讓機器人能看懂環境、聽懂指令、做出動作。這和很多隻做文字聊天的AI公司,完全不在一個賽道上。

2. 融資與上市:資本追著投年初成功登陸港交所

能在短短几年內快速崛起,離不開資本的支援。MiniMax在上市前一共完成了7輪融資,總金額高達15.5億美元,換算成人民幣差不多110億。要知道,AI行業燒錢特別厲害,能拿到這麼多融資,說明資本對它的技術和前景極度認可。

更厲害的是年1月9日,MiniMax成功在港交所上市了。這意味著它成為了AI大模型賽道里的“上市公司一員”,有了更穩定的資金來源,後續研發和產品推廣也能更有底氣。對於一家成立才4年多的創業公司來說,這個成長速度堪稱“火箭級”。

簡單說,MiniMax現在的狀態就是:有頂尖技術團隊、有充足資金、有明確的發展方向,而且已經靠上市站穩了腳跟,是AI圈名副其實的“獨角獸”。

二、創始人閆俊傑:清華博士出身,商湯“老功臣”,帶著技術理想創業

一家公司能走多遠,創始人的格局和技術實力往往是關鍵。MiniMax的創始人閆俊傑,就是典型的“技術大牛+創業實幹家”,履歷亮眼到讓人佩服。

1. 學霸履歷:從清華到中科院,一路深耕AI

閆俊傑是1989年生人,河南人,年紀不大但學術背景超硬核:清華大學自動化本科+中科院自動化所博士+清華大學計算機博士後。這一串頭銜下來,就能看出他是“根正苗紅”的AI領域科班出身,不是半路出家的“野路子”。

在學術上,他的成就也很突出:發表過100-200篇AI領域的頂會論文,Google Scholar(谷歌學術)上的引用量超過3萬次。可能有人對這個資料沒概念,簡單說,頂會論文是AI行業的“學術天花板”,能發表一篇就很不容易,而他發表了上百篇,還被同行廣泛引用,說明他的研究成果在行業內有很高的認可度。2019年,他還登上了福布斯中國30U30精英榜,算是行業內對他青年才俊身份的蓋章認證。

2. 職場經歷:商湯6年從實習生做到副總裁,攢下核心經驗

閆俊傑不是剛畢業就創業的“愣頭青”,而是有過多年大廠實戰經驗。他在商湯科技待了6年,從一個實習生一步步做到副總裁、研究院副院長、智慧城市事業群CTO,堪稱“逆襲典範”。

在商湯期間,他主導了深度學習工具鏈與演算法體系的搭建——這相當於給商湯的AI技術搭好了“地基”,後續很多產品都是在這個基礎上發展起來的。這段經歷讓他不僅懂技術,還懂團隊管理、產品落地和商業化,為後來創立MiniMax積累了關鍵經驗。

3. 創業初心:押注多模態,要做“普惠大眾”的AI

2021年,閆俊傑從商湯離職,創立了MiniMax。他的創業初心很明確:堅信“AGI(通用人工智慧)一定會實現,並且一定會服務大眾、普惠大眾”。簡單說,他不想讓AI只停留在實驗室裡,或者只服務於少數大企業,而是想讓普通人都能用得上、用得起AI。

他的技術路線也很堅定:堅持“單模型+全場景”,押注多模態融合是AGI的終局。啥意思呢?就是不搞一堆零散的模型(比如一個模型處理文字、一個處理圖片),而是打造一個“全能模型”,能同時搞定文字、語音、影片等多種資料,而且能適配不同場景(比如C端使用者聊天、B端企業辦公、內容創作等)。

從現在的發展來看,他的判斷是對的。MiniMax的多模態技術已經走在了行業前列,不管是語音模型還是影片生成模型,都有全球頂尖的表現,而這一切都離不開創始人最初的戰略佈局。

三、MiniMax的核心產品:從聊天到影片,覆蓋C端和B端,個個都是“實力派”

MiniMax的產品矩陣很清晰,主要分三大類:底層的大模型技術底座、面向普通使用者的C端應用、服務企業的To B解決方案。簡單說,就是“自己搭好技術地基,然後做自己的產品,同時也把技術開放給別人用”,兩條腿走路,既穩又快。

1. 底層技術底座:大模型是“核心引擎”,效能對標全球頂尖

如果把MiniMax的產品比作一輛汽車,那大模型技術底座就是“發動機”,所有產品的功能都靠它支撐。目前它的核心技術底座主要有三類:

(1)M系列大語言模型:開源全球第一,又快又便宜

這是MiniMax的“王牌技術”,目前已經迭代到M2版本。這款模型有多牛?用幾個關鍵資料就能說明白:

- 全球權威測評Artificial Analysis(AA)中,總分位列全球前五、開源第一,是中國開源大模型首次進入全球前五,能和OpenAI、谷歌這些矽谷巨頭同臺競技;

- 速度比谷歌的Claude Sonnet 4.5快近一倍,價格卻只有它的8%;

- 綜合成本不到OpenAI GPT-5(high)的六分之一,輸入每百萬Token只要2.1元人民幣,輸出只要8.4元。

可能有人聽不懂“Token”“開源”這些術語,咱們用大白話翻譯:

- “Token”就是AI處理文字的“基本單位”,簡單理解為“字數”就行,百萬Token大概相當於75萬字,也就是說,讓AI處理75萬字的輸入,只要2塊1,成本低到離譜;

- “開源”就是把模型的核心技術公開,讓全世界的開發者都能免費使用、二次開發。這一點特別重要,相當於MiniMax把自己的核心技術“分享出去”,既降低了行業的開發門檻,也能吸引更多人用它的技術,形成生態優勢。

而且這款模型還得到了海外巨頭的認可,比如Meta(臉書母公司)在論文中提到,MiniMax的研究是近期強化學習的突破代表,還採用了它提出的核心技術。在全球知名的AI模型呼叫平臺OpenRouter上,M2上線不到兩天,呼叫量就衝進了全球前十,足以說明它的受歡迎程度。

(2)音訊大模型:全球領先,語音生成、克隆都拿手

除了文字,MiniMax的音訊技術也是王牌。它的音訊大模型在全球處於領先地位,能實現很多實用功能:

- 情感語音生成:不只是簡單的文字轉語音,還能模仿開心、悲傷、憤怒等情緒,聽起來和真人說話沒差別;

- 語音克隆:上傳10秒音訊,就能復刻別人的聲線,不管是自媒體博主配音,還是普通人想讓AI用自己的聲音讀文章,都能實現;

- 音效合成:能生成各種場景的音效,比如下雨聲、汽車聲、遊戲音效等,滿足內容創作的需求。

這款音訊模型是很多C端產品的核心支撐,比如後面要講的Glow、Talkie,之所以能實現自然的語音互動,靠的就是它。

(3)影片生成大模型(abab-video系列):文生影片超逼真,半年產量破千萬

這是MiniMax近幾年重點發力的方向年釋出後快速爆發。簡單說,這個模型能實現“輸入一段文字,自動生成影片”,而且效果特別逼真,沒有那種生硬的“AI味”。

它的核心優勢很明顯:

- 支援文生影片、圖生影片,單段最長6秒,拼接起來就能做長影片;

- 畫面真實,物理效果自然,比如火焰、水流、人物動作都很流暢,不像有些AI生成的影片,看起來像PPT翻頁;

- 商用價值高,廣告、短劇、動漫分鏡都是核心場景,上線半年內,全球單日AI影片產量就破了千萬條。

而這款影片模型,也支撐起了它的爆款產品——海螺AI。

2. C端爆款應用:普通人能用的AI工具,覆蓋聊天、娛樂、創作

如果說大模型是“發動機”,那C端應用就是“汽車成品”,直接面向普通使用者。MiniMax的C端產品個個有特色,而且都火過一陣子,咱們一個個說:

(1)Glow:AI角色扮演聊天,早期爆款“意外走紅”

Glow是MiniMax的第一款C端爆款,也是國內早期的AI角色扮演對話產品。它的核心玩法很簡單:使用者可以在裡面建立各種角色,比如霸道總裁、溫柔學姐、動漫人物,然後和這些AI角色聊天,AI會根據角色設定回應,互動感特別強。

有意思的是,Glow的走紅其實是“意外”。創始人閆俊傑最初做它的目的,是為了收集使用者的對話資料,用來訓練大模型——畢竟AI模型需要大量資料才能變得聰明。結果沒想到,產品上線4個月,註冊使用者就爆發式增長,成了現象級產品,也讓MiniMax一下子在C端市場打響了名氣。

現在的Glow已經很成熟了,不僅角色種類更多,還支援語音聊天、自定義角色形象,很多使用者用它來打發時間、情感陪伴,甚至練習外語,成了一款真正的“國民級AI聊天工具”。

(2)星野/Talkie:多模態對話遊戲,海外營收主力

如果說Glow是“純聊天”,那Talkie就是“聊天+遊戲”的結合體。它是一款多模態對話遊戲,融合了文字、語音、圖片,還加入了數值體系和抽卡玩法,有點像“AI版的二次元遊戲”。

它的核心亮點是“互動性強”:使用者可以和AI角色進行多輪對話,不僅能打字,還能發語音、圖片,AI會根據這些資訊回應,而且角色還有好感度、等級等數值,抽卡能解鎖新角色、新語音,玩法比Glow更豐富。

這款產品在海外特別火,全球日活和知名AI產品持平,收入主要來自歐美使用者的付費抽卡,是MiniMax海外營收的主力。簡單說,它成功開啟了海外市場,讓MiniMax的C端產品走向了全球。

(3)海螺AI(Hailuo):AI影片生成工具,普通人也能當“導演”

這是MiniMax近幾年的“王牌C端產品”,上線後快速成為全球第二大AI影片生成工具,把“寫段文字→出大片”從概念變成了日常。它的核心優勢就是“簡單、逼真、能商用”,咱們用大白話說說它能幹嘛:

- 文生影片:輸入一段文字,比如“航拍俯拍,穿漢服的女生在竹林舞劍,陽光透過竹葉形成光斑,電影感,4K”,就能自動生成6秒或10秒的高畫質影片,鏡頭語言自然,沒有PPT感;

- 圖生影片:上傳兩張產品圖,AI能自動補完360°旋轉展示,比如義烏商家用它給商品做展示影片,直接投放到抖音櫥窗,點選率提升了32%;

- 角色一致性:跨鏡頭能保持人臉、服裝、道具不變,做系列短劇再也不怕“換演員”穿幫,實測10連拍主角面容誤差不到2%;

- 語音克隆:300+內建音色,上傳10秒音訊就能復刻自己的聲線,自媒體博主用它自動配音,粉絲根本聽不出來差別。

更重要的是,它的80%素材都能直接商用,不用擔心版權問題。現在很多人用它賺錢:深圳3人小團隊用它一週生成20集豎屏短劇,成本不到傳統拍攝的5%,上線TikTok後單集播放破百萬,月入2萬美元;考研名師用它把教案轉成情景動畫,節省90%後期時間,付費轉化率翻倍。

而且它上手特別簡單,5分鐘就能學會:註冊賬號→按“鏡頭+主體+動作+環境+光影+風格”的公式寫提示詞→選引數(時長、橫豎屏)→點選生成,2-5分鐘就能出片,匯出後用剪映加個字幕、BGM,就能直接釋出。2026年它還會更新,支援30秒長影片、虛擬試衣、4K超高畫質,功能會更強大。

(4)MiniMax Agent:AI智慧體平臺,能幫你處理各種複雜任務

這是一款更偏向“實用工具”的產品,簡單說就是“AI助手的升級版”。它能對接各種場景,提供個性化智慧服務,比如:

- 辦公場景:幫你寫PPT、整理會議紀要、除錯程式碼,甚至能實現多程式碼檔案的自動除錯與修復;

- 學習場景:幫你整理筆記、解答難題、生成學習計劃;

- 生活場景:幫你規劃旅行路線、訂酒店、寫文案。

它有“高效”和“專業”雙模式,輕量級對話用高效模式,複雜任務用專業模式,而且限時免費,普通人也能體驗到AI帶來的便捷。

3. To B企業服務:把技術開放給企業,賦能各行各業

除了自己做C端產品,MiniMax還把大模型技術開放給企業,提供API介面和定製化解決方案,服務了很多行業客戶。

比如它給高濟健康打造了智慧患者管理系統,用AI幫醫院整理患者資訊、提醒患者吃藥、解答常見健康問題,減輕了醫護人員的負擔;給企業提供模型訓練、推理工具,讓企業不用自己從頭研發AI,就能快速實現智慧化轉型。

這種To B模式不僅能給MiniMax帶來穩定的收入,還能讓它的技術在更多行業落地,積累更多場景資料,反過來最佳化大模型,形成“技術→落地→資料→最佳化技術”的良性迴圈。

四、關鍵澄清:MiniMax和抖音豆包沒有官方合作,是“競合關係”

這是很多人最關心的問題:MiniMax和抖音旗下的豆包到底啥關係?是不是有合作?答案很明確:沒有官方合作,兩者是獨立的AI產品與技術主體,既有競爭,也有間接的行業交集。

咱們分兩部分講,先搞懂豆包的背景,再看兩者的關係:

1. 豆包的真實背景:位元組跳動自研,靠流量快速崛起

豆包是位元組跳動(抖音母公司)自己研發的AI對話助手年上線,和MiniMax沒有任何股權或技術上的關聯。它的核心優勢很明顯:

- 背靠位元組跳動的技術實力:有自己的自研大模型,還有火山引擎的語音技術,不用依賴第三方;

- 流量優勢巨大:抖音有超7億日活使用者,豆包作為位元組的“親兒子”,能直接藉助抖音的流量推廣年底日活就破了億,成長速度特別快;

- 產品定位:消費級AI助手,主打語音互動、情感陪伴、多模態娛樂,比如幫你聊天、寫文案、生成圖片、做影片字幕,功能很全面,而且完全免費。

從技術路線來看,豆包也做多模態互動,但它的優勢在“場景豐富度”和“使用者基數”,畢竟有位元組的生態加持,能快速適配抖音、剪映等產品,使用者使用起來更方便。比如它的AI程式設計功能支援Java、Go、C++等多種語言,還能上傳圖片復刻網頁;影象生成4.0模型能生成更自然的人像,支援多圖參考,這些功能都很貼近使用者需求。

2. 兩者的“競合關係”:競爭是主流,交集是間接的

雖然沒有官方合作,但MiniMax和豆包在AI賽道上有很多重疊,既是競爭對手,也有一些間接的行業交集:

(1)直接競爭:搶使用者、搶場景

兩者的競爭主要集中在C端市場,尤其是這些場景:

- AI聊天與陪伴:MiniMax的Glow、Talkie和豆包的對話功能,都是面向普通使用者的聊天產品,都主打自然互動、情感陪伴,使用者群體有重疊;

- 多模態內容生成:MiniMax的海螺AI主打影片生成,豆包主打圖片生成、文案生成、影片字幕,都在爭奪內容創作者的使用者時長;

- 海外市場:Talkie在海外的日活很高,而豆包也在拓展海外業務,兩者在歐美市場有直接競爭。

而且它們的技術路線有重疊,都做文字、語音、視覺的多模態融合,只不過MiniMax更側重“開源+影片生成”,豆包更側重“流量+全場景覆蓋”,各有優勢,但競爭很激烈。

(2)間接交集:生態層面的小互動

兩者沒有官方合作,但在行業生態裡有一些間接交集,主要是透過第三方:

- 硬體適配:有些智慧音箱、智慧車載裝置,會同時適配多個大模型介面,可能既支援MiniMax,也支援豆包,這是硬體廠商的“多模型相容策略”,不是兩者的官方合作;

- 行業標準:都在參與AI行業的一些標準制定,比如多模態資料處理、AI安全等,可能會在行業會議、標準研討中產生間接互動,但這不是商業合作。

簡單總結:MiniMax和豆包是“各玩各的,但又在同一個賽道競爭”,沒有誰依賴誰,都是靠自己的技術和生態發展。網上流傳的“豆包用了MiniMax技術”“兩者合作推出產品”等說法,都是沒有官方依據的謠言,大家不用相信。

3. 核心差異對比:一張表看懂兩者的不同

為了讓大家更清晰,咱們用一張大白話表格,總結一下MiniMax和豆包的核心差異:

對比維度 MiniMax 豆包

所屬公司 上海稀宇極智(閆俊傑創立的創業公司) 位元組跳動(抖音母公司,網際網路巨頭)

核心技術 自研M系列開源大模型(全球前五)、音訊全球領先、影片生成全球第二 位元組自研大模型+火山引擎語音技術

產品定位 多模態AGI(文字+語音+影片),To C(聊天、影片生成)+ To B(企業服務)雙輪驅動 消費級AI助手,主打全場景覆蓋(聊天、文案、圖片、辦公),靠流量快速起量

核心優勢 開源技術強、影片生成逼真、商用素材多 流量大、使用者基數廣、功能免費、多端同步(手機+電腦)

主要使用者 內容創作者(短影片、短劇)、AI愛好者、企業客戶 普通使用者(聊天、查資料)、職場人(辦公、寫文案)、學生(學習、作業)

合作關係 無官方合作 無官方合作

五、總結:MiniMax是“技術驅動的實幹派”,豆包是“流量驅動的全能派”

最後,咱們用最簡單的話總結一下:

MiniMax是一家技術驅動的AI創業公司,創始人是清華博士出身的技術大牛,核心優勢在開源大模型、音訊和影片生成,產品既服務普通人(聊天、做影片),也服務企業,走的是“技術過硬+商業化落地”的路線,靠上市和融資獲得資金支援,在全球AI圈有很強的技術影響力。

豆包是流量驅動的網際網路巨頭產品,背靠位元組跳動的流量和生態,核心優勢在使用者基數大、功能全面、完全免費,走的是“快速迭代+全場景覆蓋”的路線,靠抖音的流量快速崛起,是普通使用者最容易接觸到的AI助手之一。

兩者沒有官方合作,是AI賽道上的競爭對手,各有優勢,也各有側重。如果你是內容創作者,想做短劇、產品影片,MiniMax的海螺AI可能更適合你;如果你是普通使用者,想找個免費的AI聊天、寫文案、查資料,豆包可能更方便。

A−
A+
護眼
目錄