🔍 Versenytárs-elemzés — VibeVox

Utolsó frissítés: 2026-04-11 Forrás: STRATEGY.md + NotebookLM mélykutatás + CEE kvantitatív piacfelmérés + Accessibility CEE Market Analysis (2026-04-10) + Strategic Architecture and Market Analysis (2026-04-11) Cél: Minden belső döntéshozó számára — részletes referencia a piaci pozícionáláshoz. Accessibility integráció: ✅ GAP-4, 6 beépítve (2026-04-10) — Dragon NaturallySpeaking migráció + Beey.ai AT kockázat Strategic Architecture integráció: ✅ beépítve (2026-04-11) — SpeakLeash/Bielik CEE-natív STT monitoring szekció hozzáadva


Tartalomjegyzék

  1. Piaci kontextus — TAM, ARR, iparági dinamika
  2. Összefoglaló áttekintés
  3. Piaci szegmentáció
  4. Részletes versenytárs-profilok
  5. Összehasonlító táblázatok
  6. Churn-analízis — miért hagyják el a versenytársakat?
  7. VibeVox stratégiai pozícionálás

Piaci kontextus

Globális piacméret és benchmark ARR számok

Az AI-alapú hang-szöveg felismerés (STT) piac 2024–2026 között nemlineáris, robbanásszerű növekedésen ment át.

Vállalat ARR (becsült) Felhasználók Funding Növekedés
Otter.ai $100M+ 35M+ $63,5M VC 56,3% YoY (2025)
Rev.com $100M+ SaaS Több százezer Corporate Stabil
Wispr Flow $25M–$50M 1M+ professzionális $81M VC 40% MoM (2025!)
Transkriptor $15M–$30M 1M+ $0 (bootstrapped) Organikus
Superwhisper $2M–$5M Több százezer MAU $0 (bootstrapped) 567% MAU növekedés (H1 2025)
MacWhisper $1,5M–$3M+ 385 000+ értékesítés $0 (bootstrapped, LTD) Bootstrapped
AquaVoice Pre-revenue Early adopter $2,75M (YC S24) Korai fázis

Megjegyzés: A Wispr Flow $81M funding és 40%-os havi növekedése kivételes — ez éves szinten 5× szorzót jelent. Ugyanakkor ez VC-pénzzel finanszírozott growth hacking, nem organikus. A Transkriptor és MacWhisper bootstrapped módon érte el hasonló skálát — ez az üzleti modelljük jobb unit economics-ára utal. A VibeVox a bootstrapped versenytársakkal együtt bizonyítja: a BYOK modell VC funding nélkül is fenntartható.

CEE részpiac — a VibeVox célpiaca

Szegmens Méret Forrás
CEE aktív Linux desktop user ~1,58 millió (PL 919K, CZ 305K, HU 225K, SK 135K) CEE kvantitatív kutatás (2026-04-07)
VibeVox SAM (fizetőképes szegmens) ~364 320 (18% a text-heavy munkakörökből) SAM/SOM modell
VibeVox SOM (18 hónap) ~763–1 274 fizető user, MRR €5 340–€8 920 SAM/SOM becslés
CEE szoftverfejlesztők 1M+ PL-ben ~300K egyedül
Globális Linux desktop arány 4,44% (2024) → 4,70% (2025) +70% növekedés 3 év alatt
Európai Linux arány 5,21% (2025 csúcs) → 3,06% (2026 stabilizálódott)

Win10 EOL migrációs lehetőség (2025 Q4–2026 Q2)

⚠️ WARNING

A Windows 10 támogatása 2025. októberben lejár. Ez egyszeri, 12–18 hónapos lehetőségi ablak, amelyet a VibeVox-nek aktívan ki kell használnia.

Metric Adat Relevancia
Win10 aktív gépek (globális) ~1,5 milliárd Ebből CEE: százmilliók
CEE-ben nincs általános TPM 2.0 (Win10 gépek) ~30–40% old hardware Win11-re nem frissíthető
Versenytársak Win10 EOL kampánya 0 (egyiknek sincs) VibeVox elsőmóvers e szegmensben
Kulcsszavak "windows 10 alternative linux" (~2000/hó) + "linux diktálás" SEO targeting lehetőség
💡 TIP

A Win10 EOL migránsok linux-újoncként érkeznek, nem power user-ként. A Flatpak AppImage + egyszerű onboarding = alacsonyabb churn a meglévő Linux user-ekhez képest (tanulási görbéjük nincs még a platformhoz kötve).

Az iparági „Retention Crisis" (2026)

A B2C és SMB AI produktivitás piac 2026-ban retenció-válságot él át.

  • Az AI-alapú appok fizetős előfizetőket 30%-kal gyorsabban veszítenek, mint a hagyományos szoftverek
  • Éves retenció: csak 21,1%
  • SMB szektorban: 30–58% éves churn az összegyűlő SaaS terhektől
  • Havi churn: tipikusan 3–7%
  • A BYOK-forradalom válasz erre: a tech-tudatos felhasználók saját API kulcsot használnak, filléres tényleges költséggel

Az iparág strukturális törésvonala

Cloud-native SaaS                    ↔    Lokális offline compute
(Wispr, Typeless, AquaVoice)              (Superwhisper, MacWhisper, Voxtype)
─────────────────────────────────────────────────────────────────
LLM post-processing + kontextus            Adat soha nem hagyja el a gépet
Privacy kockázat (screenshot, clipboard)   Hardware-korlát (8 GB RAM = lag)
Folyamatos szerver-költség                 100% gross margin, LTD lehetséges
CEE CEE-n gyengébb kis modellek           CEE-n is gyengébb kis modellek

VibeVox pozíció: A kettő között + EU Frankfurt szerver = cloud minőség + EU adatvédelem, BYOK opció.


Összefoglaló áttekintés

Az AI-alapú diktáló szoftverek piaca 2026-ban éles törésvonal mentén oszlik meg: felhő-alapú SaaS eszközök (Wispr Flow, Typeless, AquaVoice) vs. lokális offline alkalmazások (Superwhisper, MacWhisper, Voxtype). A VibeVox (VibeVox) pozíciója egyedi: EU-hosted felhő + BYOK + natív OS-integráció + CEE lokalizáció — egy kombináció, amit jelenleg egyetlen versenytárs sem kínál.

Gyors referencia táblázat

Versenytárs Ár (havi) LTD BYOK Platformok Offline CEE nyelv Fenyegetés
Wispr Flow $12–15 Win, Mac, iOS, Android 🟡 Részleges 🟡 Közepes
Typeless $12 éves / $30 havi Win, Mac, iOS, Android ✅ 100+ nyelv 🔴 Magas
Superwhisper $8,49 $249,99 🟡 Pro-hoz kötött Mac, iOS 🟡 Részleges 🟢 Alacsony
MacWhisper €269 Mac, iOS 🟡 Részleges 🟢 Alacsony
Beey.ai ~€5–25 Web ✅ HU/SK/PL/CS 🔴 Kritikus
AquaVoice $8 (éves) Win, Mac 🟢 Alacsony
Spokenly $9,99 ✅ Free tierben Mac, iOS 🟡 Model-függő 🟡 Közepes
Voxtype Ingyenes Linux 🟡 Model-függő 🟡 Közepes
OpenWhispr Ingyenes / $6,67 ✅ Free tierben Win, Mac, Linux 🟡 Model-függő 🟡 Közepes
Transkriptor $9,99–19,99 Web ✅ 100+ nyelv 🟡 Közepes
Newton Dictate Legacy lic. Win ✅ SK/CS 🟡 Közepes
AudioPen ~$8,25 éves Web, iOS, Android 🟡 🟢 Alacsony
Voicenotes $9,99 Összes 🟡 🟢 Alacsony
Otter.ai $8–30 Web, iOS, Android ❌ CEE 🟢 Alacsony
Gboard Ingyenes Android 🟡 Hibrid ❌ CEE bugos 🟡 Közepes
VoiceIn Ingyenes / ~$2 CWS csak 🟡 50+ nyelv 🟡 Közepes (top-of-funnel)
Speechnotes Ingyenes / ~$8 CWS + Web 🟡 Google Speech 🟡 Közepes (top-of-funnel)
VibeType N/A (korai fázis) ✅ Lokális Mac (korai) 🟡 Közepes (dev szegmens)
VibeScribe N/A (korai fázis) Mac 🟢 Alacsony
Dictly N/A (korai fázis) Mac, iOS 🟢 Alacsony
VoxTap N/A (korai fázis) Mac 🟢 Alacsony

Piaci szegmentáció

A versenytársak három fő szegmensbe sorolhatók:

1. Valós idejű, rendszerszintű diktálás (közvetlen versenytársak)

Ezek az alkalmazások globális hotkey-vel aktiválhatók, és bármely szövegmezőbe beírják a szöveget — pontosan az, amit a VibeVox csinál.

Versenytárs Architektúra Fő erősség Fő gyengeség
Wispr Flow Cloud SaaS, Electron Kontextus-érzékeny formázás, 1M+ user Privacy nightmare, 800 MB RAM
Typeless Cloud SaaS MrBeast marketing, Speak-to-Edit Clipboard scraping, 6 perc cap
AquaVoice Cloud SaaS, saját modell Sub-second latency (Avalon) Nincs Linux, nincs BYOK, nincs LTD
Superwhisper Lokális, Apple Silicon 100% offline privacy, 567% MAU növ. Csak macOS/iOS, drága LTD
MacWhisper Lokális, Apple Silicon BYOK támogatás, MDM, 385K értékesítés Csak macOS, memory swapping
Spokenly Lokális + BYOK cloud Ingyenes offline + BYOK, MCP szerver Csak Apple (macOS/iOS)
Voxtype Lokális, Rust 7 engine, Wayland natív Csak Linux, nincs SaaS
OpenWhispr Hibrid (lokális+cloud) BYOK free tier, Linux first-class Electron, kis user base

2. Aszinkron transzkripció (indirekt versenytársak)

Ezek nem valós idejű diktáló eszközök — fájl-feltöltéssel működnek, de a CEE piacon konkurálnak a felhasználók figyelméért.

Versenytárs Típus CEE relevancia
Beey.ai Fájl-upload → transzkripció 🔴 50K+ CEE user, tuned modellek, Newton háttér
Transkriptor Fájl-upload → transzkripció 🟡 1M+ user, $15–30M ARR, EU-hosted, 100+ nyelv
Otter.ai Meeting transzkripció 🟢 $100M+ ARR, de nincs CEE nyelv, US szerveren

3. Hangmemo-feldolgozók (távolabbi verseny)

Ezek nem globális diktálás, hanem „gondolat → szöveg" transzformáció saját felületen belül.

Versenytárs Típus Pozíció
AudioPen Hangmemo → szerkesztett szöveg „Unstructured thought processor"
Voicenotes Hangmemo → AI elemzés „Második agy" / note-taking, watchOS/WearOS is

4. Böngésző-alapú CWS diktáló extensionok (top-of-funnel versenytársak)

Ezek Chrome Web Store-on terjesztett, browser-sandboxéd diktálók. Nem rendszerszintűek — csak a böngésző belső szovöegmezőibe írnak (Gmail, Google Docs, Notion). A VibeVox-vel szemben az az egyetlen értékék, hogy 0 telepítéssel indulás előtt használhatók — ez teszi őket top-of-funnel környezetben veszedelmessé.

Versenytárs Felhasználók CEE relevancia
VoiceIn 800 000+ 🔴 Népszerű légügyisékény a CEE-ben, ingyenes, 50+ nyelv
Speechnotes 3 000 000+ 🟡 A legismértebb böngészős diktáló — de csak Google Docs használatban erős

Részletes versenytárs-profilok


1. Wispr Flow

Státusz: VC-funded ($81M), cross-platform, cloud SaaS Becsült ARR: $25M–$50M | Felhasználók: 1M+ | Növekedés: 40% MoM Fenyegetési szint: 🟡 Közepes — tud magyarul, de a privacy-botrány és az Electron bloat elbizonytalanítja a CEE tech felhasználókat.

Finanszírozás és cégháttér

Adat Érték
Összes VC tőke $81 millió
Legutolsó kör $25M Series A extension — 2025. november
Lead investor Notable Capital
Részt vevő Flight Fund (Steven Bartlett vállalkozó befektetési kara)
Stratégiai cél Saját fejlesztésű hangmodellek → „Voice Operating System"

Árazás

Terv Ár Megjegyzés
Free 2000 szó/hét Korlátozott
Pro $12–15/hó ($144/év) Egyetlen fizetős tier
LTD ❌ Nincs SaaS-only modell
BYOK ❌ Tiltott Zárt ökoszisztéma

Architektúra és funkciók

  • Intelligens formázás: Automatikus filler word eltávolítás, ismétlődő kifejezések törlése, listák strukturálása
  • Dinamikus tónus-váltás: Formális / közvetlen / nagyon közvetlen stílus automatikus alkalmazása az aktív alkalmazás alapján
  • Fejlesztői integráció: Cursor IDE kompatibilitás, lokális változónevek és fájlreferenciák felismerése
  • Cross-platform: Mac, Windows, iOS, Android

Privacy problémák — „Screenshot Privacy Nightmare"

A Wispr Flow kontextus-érzékenységének ára rendkívül magas:

  • Folyamatos screenshot capture: Az alkalmazás folyamatosan képernyőképeket készít az aktív ablakról
  • Adat továbbítás: A screenshotok + titkosítatlan hangfelvételek harmadik féltől származó felhőszerverekre kerülnek (OpenAI, Meta)
  • NDA-kötött felhasználók: Ügyvédek, orvosok, és titkosított projekten dolgozó fejlesztők számára ez azonnali törlést eredményez

Erőforrás-fogyasztás (Electron)

Metrika Mért érték Összehasonlítás VibeVox-vel
RAM (idle) ~800 MB VibeVox: ~150 MB (aktív diktálás)
CPU (idle) 8–13% VibeVox: ~0%
„Jet Engine" effektus ✅ Folyamatos ventilátorzaj VibeVox: nincs
Windows stabilitás ⚠️ Crashek, Word/VSCode fagyás VibeVox: natív, stabil

Churn okok

  1. Szemantikai inverzió: Az agresszív auto-formázás megváltoztatja a user szándékát, egész mondatokat töröl „felesleges" szövegként
  2. Hallucinációk csendben: Csend vagy háttérzaj esetén a modell random szövegeket illeszt be: „Transcription by CastingWords", „Thanks for watching", idegen nyelvű mondatok
  3. Cloud latency: 1,5–3 másodperces round-trip — flow state megszakítás
  4. Subscription fatigue: „A billentyűzet SaaS-ifikálása" — $15/hó egy billentyűzet-kiegészítőért

2. Typeless

Státusz: Cross-platform SaaS, MrBeast endorsement, agresszív affiliate program Fenyegetési szint: 🔴 Magas — 100+ nyelv, 8000 szó/hét free tier, erős brand awareness

Árazás

Terv Ár Megjegyzés
Free 8000 szó/hét Nagyon bőkezű — konverziós gate
Pro éves $12/hó ($144/év)
Pro havi $30/hó
LTD ❌ Nincs
BYOK ❌ Tiltott

Funkciók

  • 220 szó/perc diktálási sebesség — cloud-alapú, gyors
  • Speak to Edit: Kijelölhető szöveg weboldalon vagy dokumentumban, hangutasítással összefoglalható/bővíthető/átírható — AI ágensként működik
  • 100+ nyelv automatikus felismeréssel és fordítással
  • 6 perces session limit — minőségbiztosítás és margin-védelem (VibeVox-nél is 6 perc)

MrBeast endorsement

A Typeless marketingje egyedülállóan agresszív: MrBeast (Jimmy Donaldson) csapata egy „lakatlan sziget" produkcióban használta az alkalmazást, ahol gépelés helyett kizárólag hangalapú üzeneteket küldtek. Ez a mainstream disztribúciós csatorna több százmilliós elérést biztosított.

Kontextus: A Beast Industries (MrBeast holdingtársasága) ugyanekkor zárt $450M-os finanszírozási kört — ez nem a Typeless tőkéje, de a brand asszociáció rendkívül erős.

Affiliate program — az iparági benchmark

  • 25% recurring (élethosszig tartó) revenue share
  • Kifizetés: PayPal vagy Stripe Connect
  • Az „iparági Typeless-modell" — YouTuberek és bloggerek passzív jövedelemforrása
  • A VibeVox ugyanezt a 25%-os modellt alkalmazza: Stripe + Rewardful (20+ affiliate felett); launch előtt manuális UTM-alapú tracking (Google Sheets + Wise utalás)

Privacy problémák

A „Zero Data Retention" ellenére (a hang feldolgozás után törlődik, nem használják modell-tréningre):

Probléma Részlet
Clipboard scraping Jelszókezelőkből is olvas átmeneti adatot
DOM olvasás Böngésző tartalmat olvas (URL-ek, weboldalak)
Billentyűleütés figyelés macOS CGEventTap rendszerszintű hooking
Geografikus hallucináció IP-cím alapján helyi szlenget erőltet formális szövegbe

Churn okok

  1. Vállalati kill: NDA-kötött és GDPR-kompatibilis környezetben a clipboard/DOM scraping = azonnali, végleges törlés
  2. Subscription exhaustion: $144/év + 6 perces cap + privacy-aggodalmak → a user úgy érzi, „bérli a saját produktivitását"
  3. BYOK hiány: A felhasználók tudják, hogy az API költség filléres — mégis $12-t fizetnek havonta

⚠️ Kihasználható sebezhetőségek — VibeVox „True Zero Access" differenciátor

A Typeless „Zero Data Retention" ellenére az alábbi rendszerszintű adathozzáférési sebezhetőségek a VibeVox legerősebb marketing fegyverei a cybersec közösségben (P1 affiliate pillér).

Sebezhetőség Hatás VibeVox válasz
Clipboard scraping (jelszavak is!) Enterprise security blocker — password manager adatok kiszivárgása Hold-to-talk: 0 clipboard hozzáférés
Browser DOM element olvasás NDA-kötött dokumentumok, ügyvédi kommunikáció kiszivárgása Natív app: 0 browser hozzáférés
URL tracking Böngészési szokások feltérképezése — privacy sértés 0 URL tracking
IP-alapú geographic profiling Kényszerített szleng → technikai dokumentációnál katasztrofális VibeVox: nyelvi profil = user explicit választása
6 perces session limit Flow state megszakítás VibeVox: szintén 6 perc (margin védelem), de hold-to-talk = természetes szünet

Marketing narratíva: NEM „Zero Retention" hanem „True Zero Access" — mert a VibeVox-nek nincs mihez hozzáférnie (sem clipboard, sem DOM, sem URL, sem screen).

Content formátumok (P1 cybersec pillér):

  • Blog: „Typeless reads your clipboard — even your passwords"
  • Twitter thread: Side-by-side Typeless permissions vs. VibeVox (0 permissions)
  • Technikai teardown: Mátrix összehasonlítás (P1 affiliate-eknek)

A Typeless geo profiling probléma KÜLÖNÖSEN releváns a CEE fejlesztőknek: ha az IP cím alapján kényszerített szleng kerül a transzkripciókba, az technikai dokumentációnál katasztrofális. Ez kiváló content angle.


3. Superwhisper

Státusz: Bootstrapped (Y Combinator alumnus Neil Chudleigh), Apple only, offline-first Becsült ARR: $2M–$5M | Növekedés: 567% MAU (H1 2025) Fenyegetési szint: 🟢 Alacsony — csak macOS/iOS, CEE Windows/Linux userek nem érintettek

Árazás

Terv Ár Megjegyzés
Free Korlátozott
Pro havi $8,49/hó
Pro éves $84,99/év
LTD $249,99 Egyetlen fizetés, örökre
BYOK 🟡 Pro előfizetéshez kötött Fizetni kell a Pro-ért, hogy BYOK-ot használhass — dupla kifizetés

Architektúra és az Argmax Parakeet model

  • 100% offline: Whisper, NVIDIA Parakeet (Argmax implementáció), egyéb modellek lokálisan futnak az Apple Neural Engine-en
  • 567%-os MAU növekedés: Az Argmax Parakeet-re való migráció után (H1 2025) — ez az élcsúcs-modell-váltás tette robbanásszerűvé
  • Zero data transfer: A hangfelvétel soha nem hagyja el a gépet → GDPR-mentesít
  • Modell-cserélhetőség: A user letöltheti és váltogathatja a különböző AI modelleket
  • Custom prompting: A nyers szöveg automatikus formázása beillesztés előtt — egyedi utasítások alapján

Fő korlátok

Korlát Hatás
Csak Apple Windows/Linux felhasználók kizárva
8 GB RAM MacBookon Memory swapping, OS lag, crash esetek
$249,99 LTD Költségérzékeny CEE SMB-knek túl drága
BYOK gate Pro előfizet szükséges a BYOK-hoz
Nincs app-kontextus felismerés A dinamikus tónus-váltás (mint Wispr/Typeless-nél) nincs — manuális prompt kell

4. MacWhisper

Státusz: Bootstrapped (Jordi Bruin), Apple only, duális disztribúció Becsült ARR: $1,5M–$3M+ | Értékesítések: 385 000+ Fenyegetési szint: 🟢 Alacsony — csak macOS, de a BYOK támogatás és az MDM integráció erős vállalati pozíciót ad

Árazás

Terv Ár Megjegyzés
Free Alap funkciók App Store verzió
Pro LTD €269 Gumroad közvetlen letöltés
BYOK ✅ Szabad, díjmentesen iOS-en és macOS-en is

Megjegyzés: MacWhisper elsősorban LTD-alapú monetizáció — az $1,5M–$3M+ bevétel döntően egyszeri élethosszig érvényes vásárlásokból áll, nem recurring subscription-ből. Ez 100% gross margint jelent (nincs szerver-költség).

Duális disztribúció

  • App Store verzió („Whisper Transcription"): Sandboxed, korlátozott rendszer-hozzáférés
  • Gumroad verzió („MacWhisper"): Nem sandboxed — globális diktálás bármely szövegmezőbe, naptári meeting-észlelés, MDM vállalati telepítés

Fő funkciók

  • Batch processing (több fájl egyidejű feldolgozása) — újságírók, videószerkesztők kedvence
  • Felirat-generálás
  • MDM (Mobile Device Management) támogatás — vállalati IT részlegek számára
  • Apple Neural Engine gyorsítás
  • Automatikus calendar meeting detection (Gumroad verzió)

Hardware korlátok

Konfiguráció Élmény
M1/M2/M3 + 16 GB RAM ✅ Fluid, valós idejű
M1/M2 + 8 GB RAM ⚠️ Memory swapping, lag
Intel Mac ❌ Gyakorlatilag használhatatlan large-v3-mal

5. Beey.io (Newton Technologies)

Fejlesztő: Newton Technologies (ugyanaz a cég, mint a Newton Dictate fejlesztője) Felhasználók: 50,000+ CEE felhasználó Státusz: Prágai székhelyű, erős vállalati háttér Fenyegetési szint: 🔴 KONDICIONÁLIS — jelenleg NEM közvetlen versenytárs (aszinkron ≠ real-time diktáló), de ha real-time modult fejlesztenek, azonnali fenyegetés

⚡ IMPORTANT

Kulcsdifferenciáció (kutatás-validált, 2026-04-07): A Beey.io aszinkron transzkripciós eszköz — pre-recorded fájlok (videó, audio) feltöltése a web portálra → szerkeszthető átirat + felirat. NEM valós idejű OS-level diktálás. Nem injektál szöveget nyitott alkalmazásba (Praetor, mMedica, stb.). Ez a VibeVox legfontosabb differenciátora ellene.

Árazás

Terv Ár Megjegyzés
Pay-as-you-go 0,14 EUR/perc Kreditrendszer
Alap ~€5/hó 2 óra feldolgozás
Standard ~€25/hó 5 óra feldolgozás
LTD
BYOK

Architektúra és funkciók

  • Kizárólag aszinkron transzkripció: Web portálon feltöltött audio/videó → szerkeszthető átirat/felirat — nincs real-time mód
  • Nem OS-level eszköz: Nem injektál szöveget nyitott alkalmazásokba; a felhasználónak copy-paste-tel kell átvinni az EHR/jogi rendszerbe
  • Tuned CEE modellek: Regionális egyetemekkel közösen fejlesztett, lokalizált neurális felismerő modellek — HU/SK/PL/CS dialektusokra finomhangolva
  • Célszektor: Média, jog (meeting transzkripció), közigazgatás (archivált felvételek)

Aszinkron vs. Real-Time — a kritikus különbség

Workflow Beey.io VibeVox
Felvétel → szöveg (utólag) ✅ (feltöltés + feldolgozás) ✅ (real-time, <1 mp)
Élő diktálás EHR-be ❌ Nem képes ✅ OS-level injection
Diktálás vizit/tárgyalás közben ❌ Nem képes (aszinkron) ✅ Hold-to-talk, instant inject
Praetor/Kleos/mMedica-ba injektál ❌ Nem képes ✅ Bármely alkalmazásba
VDI/Citrix kompatibilis ❌ Audio routing probléma ✅ Helyi OS-en fut

Sales angle: „Ha Beey.io-t használnak meeting-ek utólagos transzkripciójához, maradhat — a VibeVox a napi élő diktálást oldja meg. Egymást kiegészítik, nem helyettesítik."

Miért potenciálisan kritikus fenyegetés (ha változna)?

Faktor Részlet
50K+ aktív CEE user Már bizonyított piaci elfogadottság — meglévő user base
Tuned CEE modellek Jobb CEE nyelvi minőség, mint a generikus Whisper
Newton Technologies háttér Erős vállalati erőforrás (Newton Dictate fejlesztője)
Hiányzó real-time JELENLEG nem valós idejű diktálás → VibeVox előnye
Bővülési kockázat Ha real-time modult fejlesztenek, azonnali CEE versenytárs

VibeVox védelmi stratégia

# Védelmi pillér Részlet
1 Workflow differenciáció Beey.io = meeting-archív eszköz; VibeVox = live input tool — különböző use case-ek
2 Időbeli előny Amíg aszinkron marad, a VibeVox monopolizálja a real-time CEE piacot
3 Linux lock-in Beey.io webes → VibeVox natív = developer és IT MSP lojalitás
4 BYOK differenciátor Beey.io nem kínál BYOK-ot → VibeVox az egyetlen „sovereignty" opció
5 AT csatorna kockázat (GAP-6) Newton Technologies archív intézményi kapcsolatok — ha Beey AT-csatornába lép (PFRON/Infoalap/klinikai bázék), a VibeVox-nek fel kell gyorsítani a direkt partnerségépítést
⚡ IMPORTANT

Negyedéves monitoring protokoll: Ellenőrizni a beey.io roadmap-ot, blog-ot és LinkedIn-posztokat real-time feature bejelentésekre. Ha real-time diktálást indítanak, azonnali versenystratégia-felülvizsgálat szükséges (positioning, árazás, CEE marketing differenciálás). AT csatorna monitoring (GAP-6): Newton Technologies archív intézményi kapcsolatai (PFRON-PL, klinikai AT, Infoalap-HU) kockázatot jelentenek. Ha Beey AT-csatornába lép, a VibeVox-nek gyorsan be kell erősíteni a PFRON/Infoalap direkt partnerséget.


6. AquaVoice

Státusz: Cloud SaaS, saját „Avalon" modell, fejlesztő-fókusz Fenyegetési szint: 🟢 Alacsony — nincs Linux, nincs BYOK, nincs LTD, nincs CEE lokalizáció

Árazás

Terv Ár Megjegyzés
Free 1000 szó (egyszeri!) Rendkívül korlátozott
Pro $8/hó (éves: $96/év) Kizárólag éves fizetés
Akadémiai 70% kedvezmény .edu emailhez kötött
LTD
BYOK ❌ Tiltott

Saját „Avalon" modell

  • Sub-second latency: 450ms – 1 másodperc válaszidő
  • Technikai jargon: 0,9% szó-szintű hibaarány corporate emaileknél
  • CLI kompatibilitás: Képes parancssori utasításokat és kódrészleteket pontosan átírni

Kritikus hibák

Hiba Hatás
Cloud-only Air-gapped vállalati környezetben használhatatlan
Hallucinated suffixek Diktálások végére „bye", „thank you" szövegeket illeszt
Formázási merevség Struktúrálatlan szövegfal, kézi prompt szükséges
Nincs Linux A CEE fejlesztő szegmens (~1,58M user) kiesik
Nincs BYOK Zárt ökoszisztéma — subscription fatigue

7. Spokenly

Státusz: Apple-only, BYOK-first, MCP szerveres fejlesztői integráció Fenyegetési szint: 🟡 Közepes — erős BYOK propozíció, de csak macOS/iOS

Árazás

Terv Ár Megjegyzés
Free Korlátlan offline + BYOK cloud Korlátlan ingyenes BYOK — erős kompetitív fegyver
Pro $9,99/hó Managed cloud, API kulcs nélkül
LTD

Architektúra és egyedi funkciók

  • Ingyenes korlátlan offline + BYOK: Az egyetlen alkalmazás, ami mindkettőt ingyen adja — erős Superwhisper-alternatíva fejlesztőknek
  • MCP szerver integráció: Direkt interfész Claude Code és más AI coding agenssel — a fejlesztők hangon vezérelhetik az IDE-jüket
  • Agent Mode: Interaktív AI overlay az aktuális képernyőre

Korlátok

Korlát Hatás
Csak Apple (macOS/iOS) A Windows/Linux user base teljesen kiesik — ez a fő gyengesége
Ingyenes BYOK = nincs bevétel Üzleti fenntarthatóság kérdéses hosszú távon
Nincs CEE lokalizáció

VibeVox vs. Spokenly: A Spokenly Apple-exkluzivitása teszi őt nem direktum fenyegetéssé a CEE Windows/Linux piacunkon. De a BYOK-stratégiájuk és az MCP integráció figyelemre méltó — a fejlesztői szegmens felé ez erős üzenet.


8. Voxtype

Státusz: Open-source, Rust, Linux-natív, 100% offline Fenyegetési szint: 🟡 Közepes — egyetlen valódi Linux-natív versenytárs, de nincs SaaS / lokalizáció

Árazás és licenc

Terv Ár
Teljes Ingyenes (open-source)

Architektúra

  • Rust implementáció: Minimális rendszerterhelés, push-to-talk daemon
  • 7 transzkripciós engine: Whisper, Parakeet, Moonshine, SenseVoice, Paraformer, Dolphin, whisper.cpp
  • GPU gyorsítás: Beépített Vulkan és CUDA support
  • 100% offline: Alapértelmezetten minden feldolgozás lokálisan

Wayland kompatibilitás — szöveg-beillesztési lánc

A Voxtype a legfejlettebb Linux szöveg-beillesztési megoldással rendelkezik:

1. wtype     → Wayland natív  (UTF-8, CJK kezelés)
2. eitype    → GNOME/KDE libei protokoll (fallback)
3. dotool    → Kernel-szintű input szimuláció (fallback)
4. ydotool   → Általános input szimuláció (fallback)
5. clipboard → Utolsó mentsvár
  • Hyprland, Sway, River tiling WM natív támogatás
  • Waybar integráció (statusbar widget)

Fő korlátok

Korlát Hatás
Csak Linux Windows/Mac/Android felhasználók kizárva
Nincs SaaS modell Nincs bevétel → fenntarthatóság kérdéses
Nincs CEE lokalizáció A UI/UX nincs magyarra, szlovákra, stb. fordítva
Offline CEE minőség Kis modellek CEE-n word salad → ld. Offline Whisper elemzés

9. OpenWhispr

Státusz: Open-source, Electron, multi-platform, BYOK-first Fenyegetési szint: 🟡 Közepes — az egyetlen BYOK-natív, Linux-first alkalmazás (AppImage, DEB, RPM)

Árazás

Terv Ár Megjegyzés
Free + BYOK Ingyenes Korlátlan transzkripció saját API kulccsal
Pro $6,67/hó ($80/év) Managed cloud + prémium funkciók

Funkciók

  • Linux first-class citizen: AppImage, DEB, RPM disztribúció — az egyedüli, ami Linuxot elsődleges platformként kezeli
  • Hibrid architektúra: Offline Whisper/Parakeet + cloud BYOK
  • Wayland natív támogatás: GNOME keyboard shortcuts D-Bus-on, persistent clipboard ownership — megbízható beillesztés
  • 100+ nyelv out of the box
  • Agent Mode: AI overlay az aktuális képernyőre, streaming AI válaszok
  • Meeting detection + live transcription automatikus
  • Automated meeting transcription és élő diktálás egyszerre

Korlátok

  • Electron: Magasabb RAM-fogyasztás a natív alkalmazásokhoz képest
  • Kis felhasználói bázis: Nincs jelentős piaci penetráció
  • Nincs CEE lokalizáció

Stratégiai válasz (VibeVox vs OpenWhispr)

Dimenzió OpenWhispr VibeVox
Architektúra Electron (~300–500MB RAM) PySide6 natív (<100MB RAM)
Árazás Free core + $6,67/hó Pro Free 180 perc + €9,99/hó Pro
BYOK ✅ Free tier-en is korlátlan ✅ €3,50/hó
Linux csomag AppImage, DEB, RPM AppImage (kész), Flatpak/Flathub (F1)
CEE filler removal ✅ HU/SK/PL/CS
GDPR compliance csomag ✅ DPA, MVCS, EU képviselő
Flathub jelenlét ✅ Fázis 1 (discovery előny)
LTD N/A (open-source = örökre ingyenes) BYOK €79 LTD

VibeVox fő fegyverei OpenWhispr-rel szemben:

  • RAM benchmark publikálás: PySide6 ~80MB vs Electron ~300-500MB — virális a Linux dev közösségben
  • CEE lokalizáció: OpenWhispr nem kínál filler word eltávolítást (ööö, hát, szóval)
  • Compliance csomag: OpenWhispr-nek nincs DPA, MVCS, EU képviselő — B2B-ben diszkvalifikálja magát
  • Flathub prioritás: OpenWhispr nincs Flathub-on — a VibeVox Flathub jelenlét GNOME Software/KDE Discover discovery előny

10. Transkriptor

Státusz: Bootstrapped, EU-hosted, aszinkron transzkripció Becsült ARR: $15M–$30M | Felhasználók: 1M+ Fenyegetési szint: 🟡 Közepes — nem valós idejű, de erős CEE nyelvi támogatás és EU compliance

Árazás

Terv Ár Megjegyzés
Lite $9,99/hó Alap, ~300 perc/hó
Pro $19,99/hó 2400 perc/hó
Enterprise Egyedi

Funkciók és pozíció

  • High-volume fájl-upload: Meeting transzkripció, felirat-generálás
  • 100% EU-hosted infrastruktúra: GDPR és Schrems II teljes megfelelés — auditable Data Processing Agreement-ekkel
  • 100+ nyelv — akár 99%-os pontosság HU/PL/SK nyelveknél (Whisper-alapú)
  • NEM valós idejű diktálás — fájl-alapú workflow

Megjegyzés: A Transkriptor $15–30M ARR-t ért el VC-pénz nélkül — ez azt bizonyítja, hogy a CEE-kompatibilis EU-hosted transzkripció piaca valóban fizető. A VibeVox-nek azonban eltérő a propozíciója: real-time, OS-szintű diktálás vs. aszinkron fájl-feldolgozás.


11. Newton Dictate

Státusz: Legacy, Newton Technologies (= Beey.ai anyacég), SK/CZ jogi szektor Fenyegetési szint: 🟡 Közepes — beágyazott pozíció a szlovák/cseh jogi szektorban

Árazás

  • Legacy licencel modell — gyakran speciális hardver (Philips SpeechMike, Sennheiser headset) szükséges
  • Drága belépési küszöb (hardver + szoftver licenc együtt)

Funkciók

  • Real-time diktálás közvetlenül harmadik féltől származó alkalmazásokba
  • Kurátált szakmai szótárak: Szláv jogi és orvosi terminológia
  • Régebbi generációs akusztikai modellek — korszerűtlen a modern AI eszközökhöz képest
  • SK/CZ jogi szektorban domináns — erős lock-in

12. AudioPen

Státusz: Web/iOS/Android, hangmemo-feldolgozó (NEM valós idejű diktálás) Fenyegetési szint: 🟢 Alacsony — eltérő use case

Árazás

Terv Ár
Free Korlátozott
Prime $99/év (~$8,25/hó)
LTD ❌ Megszűntetve (korábban $29–120)

Pozíció

  • „Unstructured thought processor": A user speaking, az LLM radikálisan átírja, összefoglalja, strukturálja a szöveget
  • NEM globális diktálás: Nem ír közvetlenül az aktív alkalmazásba
  • Web, iOS, Android, Chrome bővítmény

13. Voicenotes

Státusz: Minden platformon elérhető hangmemo AI hub Fenyegetési szint: 🟢 Alacsony — eltérő use case

Árazás

Terv Ár
Free Korlátozott
Pro $9,99/hó vagy $99,99/év
LTD „Believer Plan" ❌ Megszűntetve (első 1000 user — növekvő AI infra-költség miatt zárták le)

Pozíció

  • „AI második agy": Hosszú meetingek rögzítése, összefoglalók, action itemek, „Ask AI" korábbi jegyzetek lekérdezése
  • Minden platformon: Mac, Windows, Web, iOS, Android, watchOS, WearOS is
  • NEM rendszerszintű diktálás — kizárólag saját felületen belül

14. Otter.ai

Státusz: VC-funded enterprise meeting intelligence, 35M+ user, $100M+ ARR Fenyegetési szint: 🟢 Alacsony CEE-ben — nincs CEE nyelv, US szerveren fut

Árazás

Terv Ár
Free Korlátozott
Pro $8–16/hó
Business $20–30/hó

Funkciók

  • Meeting intelligence: Zoom, Google Meet, MS Teams beágyazott „AI Meeting Agent"
  • 35M+ felhasználó, $100M+ éves bevétel, 56,3% YoY növekedés (2025)
  • Sales pipeline automatizálás korábbi meeting adatok alapján

Kritikus CEE korlátok

Korlát Hatás
US-alapú AWS szerveren GDPR/Schrems II kockázat EU vállalatok számára
Nincs CEE nyelv Csak angol, spanyol, francia, japán
Nem valós idejű diktálás Meeting-specifikus, nem rendszerszintű

15. Google Gboard (Android beépített)

Státusz: A legelterjedtebb Android billentyűzet — ingyenes, előtelepített Fenyegetési szint: 🟡 Közepes — mindenkinél ott van, de a CEE nyelveken katasztrofálisan rosszul teljesít

A „Word Salad" Bug — miért rossz CEE-n?

A Gboard agresszív hibrid feldolgozási architektúrát használ:

1. Könnyű offline modell → azonnali, de hibás tipp
2. Közben cloud-ra streamel → pontosabb eredmény
3. A két eredmény ütközik → a szöveg újraírja magát
   → egész tagmondatok törlődnek → "word salad" kimenet

Specifikus CEE problémák

Probléma Részlet
Szöveg-újraírás A flektáló CEE nyelvek kontextusfüggő ragozását a kis offline modell rosszul találja el → a cloud javítása a már beírt szöveget felülírja
Írásjel-normalizálás „kropka" (lengyel pont) mondásakor a tulajdonnév kisbetűsre vált → „Spotkajmy się w warszawa."
Offline failure Hálózat kikapcsolásakor a Gboard az „inicializálás" állapotban ragad — súlyos offline marketing-hazugság
Szakkifejezések A Personal Dictionary-t figyelmen kívül hagyja diktáláskor — jargon → tömeg-alternatívára javít

VibeVox válasz a Gboard problémára

A VibeVox Android MVP kizárólag cloud-alapú pipeline-t használ (Groq Whisper Large v3, Frankfurt szerver):

  • A teljes mondatot holisztikusan dolgozza fel — nem szó-szintű streamelés
  • A kimondott CEE írásjel-parancsokat a backendon interceptálja, tipográfiai szimbólumra cseréli a normalizálás előtt
  • Nincs hibrid ütközés → nincs word salad

16. VoiceIn (Chrome Web Store)

Státusz: CWS extension, 800 000+ aktív felhasználó, böngésző-only Fenyegetési szint: 🟡 Közepes — top-of-funnel alternatíva a lazy usereknek, de nem rendszerszintű

Árazás

Terv Ár Megjegyzés
Free Korlátlan ❌ Régi Manifest V2 API-t használt, MV3 migració folyamatban
Plus ~$2/hó Filler word removal, custom vocabulary
LTD
BYOK Csak a VoiceIn felhőjét használja

Architektúra és korlátok

  • Csak Chrome/Chromium böngészőben működik — nincs Firefox, nincs natív app
  • Csak böngésző szövegmezőkbe ír — nem működik VS Code, Word, Excel, Slack (desktop) vagy bármely natív alkalmazásban
  • MV3 korlátok: Service Worker timeout, Offscreen Document latencia 200–700ms → „aha-pillanat" nem jön el
  • Nincs hold-to-talk: Push-to-talk gombot kell kattintani a böngészőben — nem globális hotkey
  • Adatvédelem: A hang a VoiceIn felhőjére kerül (nem EU-hosted, nincs GDPR certificáció)
Korlát Hatás
Browser-only Kizárja a teljes non-browser workflow-t (IDE, EHR, CRM, Word)
Service Worker timeout Hosszú diktálás megszakad 5 perc után
Audio latencia 200–700ms → 3-4× lassabb, mint VibeVox (~1 sec teljes pipeline-nal)
CEE filler removal ❌ Free tierben nincs; Plus-ban is inkonzisztens
GDPR megfelelés ❌ Nem EU-hosted, nincs DPA

VibeVox vs. VoiceIn — stratégiai pozíció

A VoiceIn felhasználói a legfőbb átváltdandó szegmens: már akarnak diktálni, már kipróbálták — de a browser korlát frustrálja őket (nem működik Wordban, Slackban, az IDE-ben). A VibeVox Chrome Extension companion (Fázis 2b) pontosan ezt a frustáráltált szegmenst célozza meg CWS-en.

Marketing angle (CWS landing + Extension Popup):

„VoiceIn csak a böngészőben diktál. A VibeVox bárhol — Wordban, VS Code-ban, Excelben, Slackban. Egyszeri telepítés, örök szabadság."


17. Speechnotes (Chrome Web Store)

Státusz: CWS extension + web app, 3 000 000+ felhasználó, notebook/Google Docs fókusz Fenyegetési szint: 🟡 Közepes — a legelterjedtebb böngészős diktáló, de kizárólag online

Árazás

Terv Ár Megjegyzés
Free Korlátlan alap Google Cloud Speech API-val (nem Whisper)
Premium ~$8/hó AI szöveggeneráció, export funkciók
LTD
BYOK

Architektúra és korlátok

  • Google Cloud Speech API (nem Whisper) — CEE morfológiai korlátok: HU/SK körülírásos előtagok, szenvedő szerkezetek hibásan
  • Csak online: Nincs offline mód — internet nélkül teljesen használhatatlan
  • Saját note editor felület: NEM rendszerszintű injekció — a szöveget még copy-paste-elni kell
  • 3M+ felhasználó — de ebből a CEE szegmens elhanyagolható része fizető
Korlát Hatás
Google Cloud Speech (nem Whisper) CEE minőség: HU szakszókincs ≈ 50–65% pontosság (Whisper: 92–96%)
Csak saját felületen Az összes natív alkalmazásból kizárva (EHR, CRM, IDE, Word)
Copy-paste workflow 2-3 plusz lépés minden diktálás után — flow state megélés megszakítása
Nincs offline MedTech és LegalTech vállalati környezetben diszkvalifikálja

VibeVox vs. Speechnotes — stratégiai pozíció

3M felhasználóból a legtöbb "csak kipróbálta" és eldobta — pontosan az az átéréttelés, ami újonnan érkező usereket kialakít. A Speechnotes-től való átváltás narratívája:

Marketing angle:

„Speechnotes egy note pad. A VibeVox a billentyűzeted. Írjon bárhova — a Praetorba, az IDE-dbe, a Wordba. Nem kell copy-paste többé."

CEE language quality angle:

„A Google Speech API 2024-ben még mindig nem érti a magyart. A VibeVox Groq Whisper large-v3-mal dolgozik — 92–96%-os CEE pontossággal."


18. VibeType

Státusz: Korai fázis, lokális AI voice coding asszisztens, macOS-központú Forrás: Brandkutatás közben azonosítva (2026-04-10) Fenyegetési szint: 🟡 Közepes — fejlesztői szegmensben közvetlen versenytárs, de Apple-only és nincs CEE

Termékleírás

A VibeType egy „local-first" AI-alapú hangasszisztens fejlesztőknek — hangutasításokat fordít le kóddá és rendszerakciókká, miközben az adatokat on-device tartja az adatvédelem érdekében. A „vibe coding" trend (természetes nyelvű szoftverfejlesztés AI-val) kontextusában működik.

Faktor Részlet
Típus Lokális AI voice asszisztens + kód diktálás
Platform macOS (korai fázis)
Offline ✅ Teljesen lokális feldolgozás
BYOK ✅ Lokális modell (nincs API kulcs szükséges)
CEE lokalizáció ❌ Nincs
Árazás N/A (korai fázis / ingyenes beta)
Linux ❌ Nincs

VibeVox vs. VibeType

Dimenzió VibeType VibeVox
Platform Csak macOS Windows + Linux (+ Android Fázis 4)
Célcsoport AI-natív fejlesztők (vibe coding) Dev + jogász + orvos + általános felhasználó
CEE lokalizáció ✅ HU/SK/PL/CS filler removal
Offline minőség Lokális modell (limitált CEE) Cloud Whisper large-v3 (92–96% CEE)
Árazás Ingyenes/open €3,50/hó BYOK — sustain. üzleti modell
Érettség Korai fázis / beta Production-kész SaaS

VibeVox pozíció: A VibeType a dev-szegmens Apple-only, vibe coding niche-e — a VibeVox a cross-platform, CEE-lokalizált, fenntartható alternatíva ugyanannak a fejlesztői szegmensnek.


19. VibeScribe

Státusz: AI-alapú macOS voice-to-text app, korai fázisú SaaS Forrás: Brandkutatás közben azonosítva (2026-04-10) — vibescribe.me Fenyegetési szint: 🟢 Alacsony — csak macOS, nincs CEE, nincs Linux

Termékleírás

A VibeScribe egy macOS-alkalmazás, amely real-time speech-to-text transzkripciót kínál, egyedi AI finomítási stílusokkal (custom prompts). Floating caption window és privacy-fókuszú feldolgozás.

Faktor Részlet
Típus AI-alapú voice-to-text, macOS
Platform Mac only
Offline ✅ Részben (privacy-focused processing)
BYOK
CEE lokalizáció
Linux

VibeVox differenciátor: VibeScribe = Apple-only, CEE-képtelen, nincs BYOK. A VibeVox = cross-platform, CEE-lokalizált, BYOK-first.


20. Dictly

Státusz: Natív macOS + iOS offline dictation app — 2025 végén jelent meg Forrás: Brandkutatás közben azonosítva (2026-04-10) Fenyegetési szint: 🟢 Alacsony — Apple-only, nincs Linux/Windows, nincs CEE

Termékleírás

A Dictly 2025 végén megjelent natív macOS és iOS alkalmazás — private, local, offline voice-to-text diktálásra. Real-time transzkripció, custom dictionary profilok (szakszókincs), és teljes on-device feldolgozás jellemzi.

Faktor Részlet
Típus Natív offline dictation
Platform macOS + iOS
Offline ✅ 100% on-device
BYOK N/A (lokális modell)
CEE lokalizáció
Linux
Árazás N/A (korai fázis)

VibeVox differenciátor: Dictly = Apple-only, lokális minőség (gyengébb CEE). VibeVox = cloud Whisper large-v3 minőség, cross-platform, CEE filler removal.


21. VoxTap

Státusz: Lightweight macOS offline dictation tool Forrás: Brandkutatás közben azonosítva (2026-04-10) Fenyegetési szint: 🟢 Alacsony — Apple-only, minimális funkciókészlet

Termékleírás

A VoxTap macOS és iOS-alkalmazás: lightweight, offline diktáló tool egyéni hotkey-vel, az aktív szövegmezőbe ír. A VibeVox-hez hasonló „hold-to-talk" paradigmát követ, de csak Apple platformon.

Faktor Részlet
Típus Offline dictation, hold-to-talk gesztus
Platform macOS
Offline ✅ On-device
BYOK N/A
CEE lokalizáció
Linux

VibeVox pozíció: A VoxTap ugyanazt az UX-paradigmát követi (hold-to-talk, lightweight), de Apple-only és CEE-képtelen. A VibeVox a Windows/Linux cross-platform alternatíva ugyanennek a user típusnak — aki a privacy-t és a minimalizmust értékeli.


Árazás-összahasonlítás

Versenytárs Havi ár Éves ár LTD VibeVox vs.
Wispr Flow $12–15 $144 VibeVox Pro: €9,99/hó = olcsóbb
Typeless $30 havi / $12 éves $144 VibeVox Pro: €79/év = 45% olcsóbb
Superwhisper $8,49 $84,99 $249,99 VibeVox LTD: €79 = 68% olcsóbb
MacWhisper €269 VibeVox LTD: €79 = 70% olcsóbb
AquaVoice $96 VibeVox Pro éves: €79 = olcsóbb
Spokenly $9,99 VibeVox BYOK: €3,50/hó = 65% olcsóbb
Otter.ai $8–30 $96–360 VibeVox Pro: €79/év = 18–78% olcsóbb
VibeVox Pro €9,99 €79/év ❌ Nincs Pro = havi vagy éves; LTD nincs
VibeVox BYOK €3,50 €79 LTD Kizárólag BYOK tierhez — Versenytárs-tördő ár

Piaci skála összehasonlítás

Versenytárs ARR (becsült) Felhasználók Finanszíroz.
Otter.ai $100M+ 35M+ VC
Wispr Flow $25M–$50M 1M+ VC ($81M)
Transkriptor $15M–$30M 1M+ Bootstrapped
Superwhisper $2M–$5M Több százezer Bootstrapped
MacWhisper $1,5M–$3M+ 385K+ értékesítés Bootstrapped
Beey.ai N/A 50K+ CEE Newton Tech.
VibeVox (cél) CEE first Bootstrapped

Privacy és biztonság összehasonlítás

Versenytárs Screenshot Clipboard Billentyűzet Audio Szerver lokáció
Wispr Flow 🔴 Folyamatos 🔴 US/Meta cloud US
Typeless 🔴 Scraping 🔴 CGEventTap 🟡 Zero retention US
Superwhisper ✅ Lokális Nincs szerver
MacWhisper ✅ Lokális Nincs szerver
Spokenly ✅ Lokális/BYOK Nincs/BYOK
AquaVoice 🟡 Cloud US (?)
Otter.ai 🔴 US AWS US
VibeVox ✅ EU Frankfurt EU Frankfurt

Platform-lefedettség

Versenytárs Windows macOS Linux Android iOS Web CWS Extension
Wispr Flow
Typeless
Superwhisper
MacWhisper
Spokenly
Beey.ai
AquaVoice
Voxtype
OpenWhispr
Otter.ai
VoiceIn ✅ (böngésző-only)
Speechnotes ✅ (böngésző-only)
VibeVox Fázis 5 Fázis 4 Fázis 5 ✅ (Fázis 2b, Native Messaging)

BYOK támogatás összehasonlítás

Versenytárs BYOK? Feltétel VibeVox előny
Wispr Flow ❌ Tiltott ✅ VibeVox: BYOK €3,50/hó
Typeless ❌ Tiltott ✅ VibeVox: BYOK €3,50/hó
Superwhisper 🟡 Pro-hoz kötött $8,49/hó kell a BYOK-hoz is ✅ VibeVox: BYOK önálló terv
MacWhisper ✅ Szabad Díjmentes 🟡 MacWhisper: csak Apple
Spokenly ✅ Free tierben Ingyenes, korlátlan 🟡 Spokenly: csak Apple
AquaVoice ❌ Tiltott ✅ VibeVox: BYOK €3,50/hó
OpenWhispr ✅ Free tierben Korlátlan, ingyenes 🟡 OpenWhispr: nincs CEE lok.
VibeVox Önálló BYOK Plan €3,50/hó — LTD: €79

Churn-analízis

A NotebookLM kutatás (2026-04-04) az AI STT appok piacán 30–58% éves churn rátát mér. Havi szinten ez 3–7% havidíj-lemorzsolódást jelent. Az éves retenció az iparágban csupán 21,1% — ez 2026-os adat, és az iparági „retention crisis" jele.

Fő churn-okok és az érintett versenytársak

Churn ok Érintett versenytárs VibeVox válasz
Privacy-botrány (screenshot, clipboard) Wispr Flow, Typeless Hold-to-talk, zero scraping, EU Frankfurt szerver
Electron / RAM bloat Wispr Flow (~800 MB) Natív PySide6, <100 MB RAM
Subscription fatigue Wispr ($15), Typeless ($12) BYOK €3,50/hó, LTD €79 — „ne béreld a produktivitásodat"
Szemantikai inverzió (auto-format hibák) Wispr Flow Opcionális filler removal — a user dönt, nem az AI
AI Ghostwriter szindróma (mondatátírás, stílusmódosítás) Wispr Flow, Typeless Literal Mode default — VibeVox soha nem „javít" stilisztikailag
Hallucinations (csend → random szöveg) Wispr Flow, AquaVoice Hold-to-talk = nincs csend-feldolgozás; kliens VAD réteg (Fázis 1)
Cloud latency (1,5–3 sec) Wispr Flow, AquaVoice Groq Whisper: ~1 sec pipeline
Geográfiai profilozás (IP-alapú szleng-injekció) Typeless VibeVox: explicit user-beállított Primary Language, nincs IP-alapú módosítás
6 perces session limit Typeless VibeVox is 6 perc — de mint „quality assurance", nem limitáció
CEE nyelvi minőség Gboard, offline modellek Groq Whisper large-v3 holisztikus feldolgozás
Nincs Linux Wispr, Typeless, AquaVoice VibeVox: AppImage, Flatpak, .deb, .rpm, AUR
Hardware korlát (offline modellek) Superwhisper, MacWhisper 8 GB RAM-on VibeVox: cloud-alapú, nincs hardware taxon

Erőforrás-fogyasztás Benchmark (kutatás alapján, 2026-04)

Forrás: Churn post-mortem felmérés és user community reports. Ezek a számok landing page-en, sales PDF-ben és PH gallery-ben közvetlen marketing anyagként használhatók.

App RAM (idle) CPU (idle) Architektúra Battery hatás VibeVox előny
Wispr Flow ~800 MB 8–13% Electron wrapper „Jet Engine" fan noise 8× kevesebb RAM
MacWhisper 1.6 GB+ Változó Lokális Whisper model Severe battery drain Cloud = nincs lokális modell
Superwhisper 1.2 GB+ Változó Lokális Whisper model Severe battery drain Cloud = nincs lokális modell
AquaVoice ~200 MB Alacsony Cloud-only Alacsony Offline fallback opció
VibeVox <100 MB <2% Natív PySide6 Minimális

Landing page copy: „A VibeVox 8× kevesebb memóriát használ, mint a Wispr Flow. Nem harcol az IDE-vel — csendben vár, amíg szükséged van rá."


VibeVox stratégiai pozícionálás

A 4 fő marketing hook

Hook 1: „Anti-Surveillance Garancia"

„Mikrofon. Nem surveillance eszköz. Zero screen-scraping, zero clipboard reading. 100% EU Frankfurt szerveren."

Bonus B2B hook: VDI/Citrix-kompatibilis — nem routol hangot a remote session-ön keresztül, nincs karakter-kiesés.

Célzott versenytárs exodus: Wispr Flow screenshot-botrány + Typeless clipboard scraping B2B célcsoport: Klinikai IT MSP-k és VDI-t üzemeltető jogi irodák

Hook 2: „Az Electron Bloat Vége"

„Natív OS integráció, <100MB RAM. Nem harcol az IDE-vel memóriáért. Nincs Electron."

Célzott versenytárs exodus: Wispr Flow 800 MB RAM + MacWhisper 1,6 GB modell

Hook 3: „Az Előfizetés Halott"

„BYOK 3,50 EUR/hó. LTD 79 EUR. Ne béreld a produktivitásodat."

Célzott versenytárs exodus: Wispr $15/hó + Typeless $12/hó + Superwhisper LTD $249,99

Hook 4: „Diktálás Citrix-ben, végre latency nélkül" (B2B-specifikus)

„A VibeVox a helyi OS-en fut — a VDI session csak egy ablak. Nincs audio routing, nincs character drop."

„Ha lehet benne gépelni, lehet benne diktálni — Praetorban, mMedicá-ban, netDoktorban, mindenütt."

Célzott B2B szegmens: Klinikák és jogi irodák Citrix/VDI környezetben Miért egyedi: Egyetlen cloud diktáló sem oldja meg a VDI latency problémát — a VibeVox OS-level architektúrája natívan megkerüli.

Versenytárs Exodus Messaging — „Fatal Flaw Profiles"

Forrás: Churn post-mortem kutatás (2026-04). Minden vezető versenytársnak van egy azonosítható „fatal flaw"-ja, amely felhasználók aktív elvándorlását okozza. A VibeVox marketing ezeket a specifikus fájdalmakat célozza.

Versenytárs „Fatal Flaw" Profil VibeVox Exodus Messaging
Wispr Flow „A Surveillance Resource Hog" „800MB RAM + screenshot scraping? Próbáld a VibeVox-t: <100MB, zero surveillance."
Typeless „A Geográfiailag Zavarodott Sandbox" „6 perces limit + IP-alapú szleng? A VibeVox nem profiloz és nem limitál."
AquaVoice „A Felhőhöz Láncolt Írnok" „Repülőn nem működik? A VibeVox hold-to-talk — offline feldolgozás is opció."
Superwhisper/MacWhisper „Az Aranyozott Nehéz Ketrec" „$249 LTD + csak Apple + 1,6GB RAM? VibeVox BYOK €79 LTD, Windows + Linux."

Használat: Landing page comparison section · PH First Comment · Reddit exodus válaszok · Affiliate briefing

VibeVox egyedi pozíció — amit senki más nem kínál

Kombináció Miért egyedi
EU Frankfurt szerver + BYOK + natív app + Linux támogatás ✅ Egyetlen ilyen versenytárs sem létezik
CEE lokalizált UI (HU/SK/PL/CS) + cloud Whisper large-v3 ✅ Beey.io-nak nincs real-time injection; Transkriptor-nak nincs diktálás
€3,50/hó BYOK Plan + €79 LTD ✅ 68–70%-kal olcsóbb LTD mint Superwhisper/MacWhisper
<100 MB RAM + globális hotkey + valós idejű diktálás ✅ Csak offline tools teljesítik a RAM-limit, de nincs cloud minőség
Hold-to-talk + filler word removal (CEE-specifikus) ✅ „ööö", „hát", „szóval" — CEE-specifikus, egyedi
Windows + Linux + Android (tervezett) egyetlen kódbázisból ✅ Nincs más versenytárs mind a három platformon
OS-level injection — VDI/Citrix kompatibilis (nincs audio routing) ✅ Egyetlen cloud diktáló sem oldja meg a VDI latency problémát natívan
Praetor, mMedica, EESZT web — bármely alkalmazásba injektál ✅ Zero API integráció szükséges — ha lehet gépelni benne, lehet diktálni

MedAssist (Precognox) — Magyar orvosi versenytárs (HU)

Státusz: Helyi, specializált AI transzkripciós eszköz — közvetlen konkurens a HU orvosi szegmensben Fejlesztő: Precognox Kft. (hazai kutatás-fejlesztési grants) Fenyegetési szint: 🟡 Közepes — orvosi niche-ben releváns, de zárt ökoszisztéma

Termékleírás

A MedAssist egy NLP-alapú orvosi transzkripciós eszköz, amely strukturált ambuláns lapokat generál rögzített orvos-beteg hanganyagból. A Precognox Kft. fejlesztette hazai kutatási finanszírozással.

Faktor Részlet
Működési mód Felvétel → NLP feldolgozás → strukturált orvosi dokumentum
Integráció Dedikált orvosi dokumentáció platform — zárt ökoszisztéma
Célcsoport Magyar általános orvosok, ambuláns rendelők
Árazás N/A (kutatási finanszírozás; kereskedelmi ár ismeretlen)
Platform Nem OS-level — dedikált kliens

VibeVox vs. MedAssist

Dimenzió MedAssist (Precognox) VibeVox
Működési mód Aszinkron felvétel → post-processing Real-time OS-level injekció
EHR kompatibilitás Saját platformon belül Bármely EHR-be (netDoktor, Cloudent, EESZT web)
Rugalmasság Zárt ökoszisztéma Bármely alkalmazásba diktál
Hozzáférhetőség Kutatási pilot — nem széles körben elérhető Production-kész SaaS
Ár Ismeretlen / grant-alapú €3,50/hó BYOK vagy Pro terv
EU compliance 🟡 Részben ismert ✅ Frankfurt szerver + DPA dokumentált

VibeVox válasz: A MedAssist egy specializált, zárt eszköz — VibeVox az universális, nyílt alternatíva. Ha az orvos a MedAssist-en kívül bármit diktálni akar (email, lelet, recept), VibeVox az egyetlen megoldás. A pitch: „Nem váltod le a MedAssist-et — hanem kiegészíted azzal, ami kimaradt."


ZnanyLekarz „Noa Notes" — Monitoring (PL orvosi szektor)

⚠️ WARNING

Feltörekvő in-platform fenyegetés: A ZnanyLekarz (Docplanner) — amely 20,000+ lengyel klinikát szolgál ki — bevezette a „Noa Notes" AI funkcióját, amely automatikus orvosi dokumentálást kínál. Jelenleg csak a ZnanyLekarz EDM modulján belül működik, nem OS-level eszköz. A VibeVox bármilyen alkalmazásba injektál — ez az előnye. De ha a Docplanner kiterjeszti az AI diktálást platformszinten, az a PL orvosi szegmenst veszélyezteti.

Faktor Részlet
Platform Web SaaS (ZnanyLekarz.pl)
AI funkció „Noa Notes" — automatikus orvosi diktálás a saját EDM modulban
Felhasználók 20,000+ klinika (Docplanner hálózat)
Jelenlegi fenyegetés 🟡 Közepes — zárt platform, nem universal tool
VibeVox differenciátor VibeVox bármely alkalmazásba injektál; Noa Notes csak ZnanyLekarz-on belül

Monitoring: Negyedévente ellenőrizni a Docplanner feature changelog-ot és blog-ot.


SpeakLeash/Bielik — CEE-natív Open-Source STT (PL · Monitoring)

⚠️ WARNING

Fenyegetési szint: 🟡 Közepes — 2027+ horizont · Jelenleg: korai monitoring Forrás: Strategic Architecture and Market Analysis (2026-04-11)

A SpeakLeash egy lengyel open-source AI konzorcium, amelynek fő terméke a Bielik alapnyelvi modell. A projekt 2024-ben több millió token lengyel korpuszon tanított modellt publikált, és aktívan bővül CEE NLP területen.

Faktor Részlet
Szervezet SpeakLeash initiative — lengyel akadémiai és ipari konzorcium
Termék Bielik LLM (PL natív, open-source) — primárisan NLP/LLM, STT komponens roadmapban
Jelenlegi STT státusz ❌ Nincs production STT release (2026 Q2) — korai kutatási fázis
CEE morfológiai előny ✅ PL natív — agglutináló morfológia és diakritikus karakterek natív kezelése
Ár / licenc Open-source (Apache 2.0 / MIT várható) — ingyenes deployment
Fenyegetési horizon 2027–2028: ha community fine-tuning STT modult hoz létre és a WER eléri a Whisper large-v3-turbo szintet

Mi változtatna ezen?

  • Ha a SpeakLeash STT WER ≤ 6% PL-en (Whisper szint) → BYOK provider opcióként integrálható a VibeVox-be
  • Ha community deployment megjelenik → a VibeVox BYOK ökoszisztémájába becsatornázható (nem fenyegetés, hanem opportunity)
  • Ha standalone PL diktáló app jelenik meg a SpeakLeash modellre alapozva → közvetlen fenyegetés a PL szegmensben

Monitoring feladat: Negyedévente ellenőrizni a SpeakLeash GitHub changelog-ját, Bielik release note-okat, és a lengyel AI közösségi fórumokat (PyTorch PL, AI Devs PL).



Gboard CEE hibák — Android Launch Marketing (Fázis 4)

A VibeVox Android launch (Fázis 4) legerősebb marketing fegyvere — a Gboard az Android egyetlen beépített alternatívája, és a hibái dokumentálhatóak és reprodukálhatóak CEE nyelveken.

Hiba Leírás VibeVox megoldás
„Word Salad" Offline+cloud hybrid → szöveg önátíródik, töröl mondatrészeket Tisztán cloud → Whisper v3 egészben dolgozza fel a hangot
Normalization Bug PL: „Spotkajmy się w Warszawa kropka" → „w warszawa." (kisbetű!) Backend-oldali írásjel mapping a post_process előtt
Jargon Gap Personal Dictionary ignorálva voice mode-ban (IT/jogi/orvosi szavak autocorrect-elődnek) BYOK prompt context + vocabulary.db injekció

Android launch marketing hook (Fázis 4 landing page):

„A Gboard nem érti a magyar/lengyel/cseh nyelvet. Nem azért, mert nem tudja — hanem mert a saját offline modellje harcol a felhő modellel. A VibeVox nem kompromisszumol: egy modell, egy feldolgozás, tökéletes eredmény."

„Gboard vs VibeVox" összehasonlítás (konverziós blokk):

Gboard VibeVox
CEE morfológia ❌ Normalization bug ✅ Whisper v3 natív
Saját szótár (voice) ❌ Ignorálva ✅ Prompt injection
Szöveg önátírás ❌ Word salad ✅ Single-pass cloud
Adattárolás ❌ Google servers ✅ EU Frankfurt
Linux platform ❌ Nincs ✅ Natív

Cross-Device Sync Versenytársak (Android wireless mic kontextus)

A VibeVox Fázis 4 „wireless mic mód" funkciója közvetlenül versenyez ezekkel az eszközökkel a cross-device workflow piacon — különösen a Linux power user szegmensben (~1,58M CEE felhasználó).

Eszköz LAN/WAN Linux Android 12+ clipboard VibeVox előny
KDE Connect Csak LAN ❌ Manuális „Send Clipboard" gomb WAN-on is működik, FCM, automatikus
Phone Link WAN ⚠️ Microsoft telemetria Natív Linux + Windows
Syncthing LAN/WAN ❌ Nincs clipboard mgmt Szöveg-specifikus, nem fájl
Pushbullet WAN ⚠️ ⚠️ Elhanyagolt fejlesztés Aktívan fejlesztett, privacy-first

KDE Connect korlát — miért fontos:

  • Android 10+ elvette a háttér-clipboard olvasási jogot → KDE Connect „Send Clipboard" gombja manuális felhasználói akciót igényel
  • Cellular/5G hálózaton → nem működik (LAN-only architektúra)
  • Linux power userek ismerik és szeretik a KDE Connect-et, de tudják a korlátait

Marketing pozícionálás (Fázis 4 launch):

„A VibeVox wireless mic mód = amit a KDE Connect clipboard akart lenni, de az Android 10+ megölte. Mi nem clipboard-ot küldünk — szöveget. WAN-on is. Cellular-on is. Automatikusan."


CEE AI STT Startupok — 12-18 hónap figyelési lista

Forrás: Competitive Intelligence Report (2026-04-08) — VibeVox vs. Beey.ai Frissítve: 2026-04-08 | Prioritás: Backlog / P2 (doc monitoring, nincs fejlesztési cost)

Ezek a CEE-specifikus AI startupok jelenleg nem közvetlen versenytársak, de technikai kapacitásuk és lokalizált pozíciójuk alapján 12-18 hónap múlva valós fenyegetéssé válhatnak.

VoiceLab.ai (Lengyelország)

Dimenzió Adat
Profil B2B Conversational Intelligence, TRURL LLM (PL), Wordlify mobil app
Jelenlegi termék Wordlify: automatikus találkozó-transzkripció — mobil/web fókusz
Veszély a VibeVox-re Közepes — 12-18 hónap
Miért nem most? Wordlify mobil/web — nincs OS-szintű diktálás, nincs Linux
Monitor Wordlify roadmap, GitHub aktivitás, lengyel lokalizáció depth
Differenciátor VibeVox-től VibeVox: Linux-native + BYOK + OS-injection; VoiceLab: B2B enterprise fókusz, mobil

„VoiceLab currently operates an application called 'Wordlify,' which automatically transcribes conversations and meetings primarily via mobile devices. VoiceLab's deep, localized expertise in real-time Polish speech recognition and their robust existing API infrastructure indicate they are technically highly capable of building a direct VibeVox clone if they perceive sufficient market demand."

Watch signals: Ha Wordlify desktop appot jelent be / Ha VoiceLab OS-szintű injectiont fejleszt / Ha PL B2C diktálásba lép.


Vatis Tech (Románia / Magyarország)

Dimenzió Adat
Profil API-first STT infrastruktúra, <700ms latencia, 95% domain accuracy
Jelenlegi termék Enterprise backend API — telco, bank, call center
Veszély a VibeVox-re Alacsony-közepes: infrastructure vendor, nem consumer app
Lehetőség Potenciális partner: HU/SK dialektusokban Groq alternatíva
Monitor Ha consumer dictation client-et indít (B2C pivot)

„They boast exceptional backend API infrastructure capable of supporting real-time streaming via WebSockets, claiming latencies of less than 700 milliseconds [...] However, Vatis Tech operates primarily as an infrastructure provider (an API vendor) rather than building a B2C application layer."

Watch signals: Ha Vatis Tech saját desktop/web klienst indít / Ha HU/SK B2C piacra lép / Ha VibeVox BYOK providerként integrálható-e.


Techmo (Lengyelország)

Dimenzió Adat
Profil AGH University spin-off, enterprise-only STT (telco, bank, call center)
Jelenlegi termék B2B enterprise platform — nem B2C retail
Veszély a VibeVox-re Alacsony — B2C retail piacra belépés nem valószínű
Monitor Ha consumer dictation-ba lép

KInIT / Nettle.ai (Szlovákia)

Dimenzió Adat
Profil SlovakBERT kutatás (KInIT) / enterprise voicebot (Nettle.ai)
Jelenlegi termék Open research + B2B voicebot — nem OS-szintű diktálás
Veszély a VibeVox-re Alacsony — open research, nem közvetlen competitor
Lehetőség SlovakBERT downstream modellek javíthatják VibeVox SK feldolgozást — partner lehetőség
Monitor SlovakBERT fine-tuned STT model megjelenése

Monitoring checklist (negyedévente)

  • VoiceLab Wordlify desktop app bejelentés?
  • Vatis Tech consumer pivot?
  • Új CEE-specifikus OS-level diktáló startup?
  • Newton Technologies / Beey.ai real-time feature bejelentés?

Dokumentum státusz: Frissítve 2026-04-10 (4 új versenytárs hozzáadva brandkutatás alapján: VibeType #18, VibeScribe #19, Dictly #20, VoxTap #21 — mind Apple-only, alacsony fenyegetés. + 2026-04-08: CEE AI STT Startupok figyelési lista + 2026-04-07: CEE B2B/SMB + Android Blueprint). Frissítendő, ha:

  • A Beey.io real-time diktálást fejleszt (KRITIKUS!)
  • A Wispr Flow BYOK-ot vezet be (csökkentené a VibeVox BYOK előnyét)
  • A Spokenly Windows/Linux-ra terjeszkedik
  • A ZnanyLekarz Noa Notes OS-level diktálást vezet be (PL orvosi fenyegetés)
  • VoiceLab.ai Wordlify desktop appot jelez be
  • Vatis Tech B2C pivot jel
  • VibeType Linux/Windows-ra terjeszkedik (dev szegmens kockázat!)
  • Új CEE-specifikus versenytárs lép piacra

Linux ETK — Existing Tool Landscape Mátrix ✅ [Win10 EoL GTM — GAP-7 beépítve]

⚡ IMPORTANT

A riport Linux ETK ajánlása (GAP-7): A Win10 migráns fejlesztők és power userek már meglévő, de fragmentált és korlátozott Linux voice toolokat használnak. Ez a mátrix dokumentálja a tényleges Linux-on létező eszközöket és azt, hogy a VibeVox miért nyeri meg ezt a versenyt.

Általánosan elérhető Linux voice toolok

Eszköz Típus Elérhetőség Linuxon Korlátok VibeVox előny
GNOME Speech Recognition Built-in (GNOME 44+) ✅ Natív Csak GNOME, nincs globális hotkey, nincs custom vocab Cross-DE, hold-to-talk, custom vocab
KDE Dictation Built-in (KDE Plasma 6) ✅ Natív Csak KDE, offline Vosk motor (gyengébb minőség) Whisper minőség, BYOK, cross-DE
Speechnotes (web) Browser-based ✅ Browser-ben Nincs system-wide injection, nem natív OS-szintű szöveg beillesztés
VoiceIn (Chrome ext.) Browser extension ✅ Chrome-ban MV3 korlátok, csak böngészőben Bármely alkalmazásban működik
nerd-dictation CLI + Vosk ✅ GitHub Parancssori beállítás, nincs GUI, Vosk minőség GUI, Whisper, CEE языki, BYOK
Whisper CLI (直接) CLI ✅ pip install Nincs real-time, fájl-alapú, nincs integration Real-time, hold-to-talk, injection
whisper.cpp CLI ✅ compiled Nincs GUI, nincs integration GUI + workflow integration
Google Chrome Voice Input Browser ✅ Browser-ben Csak web, nincs natív app integration System-wide, offline-capable BYOK
Orca Screen reader STT ✅ Accessibility Accessibility fókusz, nem diktáló tool Diktálás fókusz, nem SR

Win10 migráns specifikus fenyegetések és válaszok

Migráns szokása Win10-en Linux megfelelő (elégtelen) VibeVox megoldás
Windows Voice Access (Win+H) GNOME Speech (DE-only, korlátolt) Hold-to-talk, system-wide, minden DE
Dragon NaturallySpeaking Nincs Linux natív Dragon BYOK + Domain Mode → hasonló minőség
Word diktálás (beépített) LibreOffice Writer STT (gyenge) System-wide injection Works minden appban
Edge Immersive Reader Nincs Linux megfelelője VibeVox + Text-to-Speech: olvasás + diktálás
Cortana diktálás — (teljesen eltűnt) VibeVox az egyetlen Cortana replacement Linuxon

Összefoglaló — miért nyeri a VibeVox a Linux ETK versenyt

Linux ETK versenypozíció összefoglalás:

  NINCS egyetlen kereskedelmi, cross-DE, hold-to-talk,
  Whisper-minőségű, CEE-lokalizált diktáló app Linuxon.

  A fragmentált open-source toolok (nerd-dictation, whisper.cpp)
  technikai felhasználókat céloznak — a Win10 migráns
  non-fejlesztő professionális (VA, ügyvéd, orvos) számára
  ezek nem opciók.

  VibeVox = az egyetlen produkt-szintű megoldás erre a szegmensre.
ℹ️ NOTE

Frissítési trigger: Ha a GNOME/KDE beépített diktálás Whisper backendre vált és cross-DE-vé válik, ez az ETK mátrix elavul. Figyeljük: GNOME Speech plugin roadmap + KDE Plasma 6.x changelog negyedévente.


Zero-Knowledge Sync Versenyelőny ✅ [2026-04-17 hozzáadva]

⚡ IMPORTANT

Ez a szekció dokumentálja azt a privacy differentiatort, amit egyetlen versenytárs sem kínál 2026-ban.

Miért nem implementál E2E titkosítást a Wispr Flow vagy a Typeless?

Az E2E titkosítás technikai összetettsége nem negligálható — de egy $81M VC-finanszírozott startup számára (Wispr Flow) bőven lefejleszthető lenne. Mégsem teszik. Az ok strukturális:

Ok Magyarázat
Surveillance-modell kizárja Wispr Flow az AI kontextualizálást screen/DOM scraping alapján csinálja — E2E titkosítás ezt technikailag lehetetlenné tenné
Analytics dependency Mindkét cég user behavioron alapuló AI tanítást végez — ha az adat titkosított, ez lehetetlen
A VC elvárja a data monetizálást A befektetők long-term értéket látnak a user data aggregációban → zero-knowledge ellentétes az üzleti modellel

Versenytárs sync privacy összehasonlítás

Szolgáltató Cloud sync E2E titkosítás Local-Only mód Zero-Knowledge
Wispr Flow ✅ (kötelező)
Typeless ✅ (kötelező)
Superwhisper ✅ iCloud ❌ (Apple szintű) ➖ korlátolt
MacWhisper ❌ nincs sync ✅ (offline only)
VibeVox ✅ opcionális ✅ AES-256-GCM ✅ Local-Only toggle ✅ jelszó soha nem megy szerverre

Miért hinni a VibeVox-nek?

A zero-knowledge garancia nem önbevallás jellegű — technikai architektúra-szintű bizonyíték:

  1. Password reset LEHETETLEN — ha a jelszót mi is tárolnánk, visszaállíthatnánk. Ha nem tudjuk visszaállítani, ez matematikailag bizonyítja, hogy soha nem volt hozzáférésünk
  2. Nyílt forráskódú encryption.py — a titkosítási modul auditálható
  3. Supabase-ben csak titkosított blob — ha a Supabase-t feltörik, az adatok olvashatatlanok

Marketing üzenet: „Ha elveszíti a jelszavát — mi sem tudjuk visszaállítani. Ez nem bug. Ez a garancia." Ez az egyetlen állítás, amit egyetlen versenytárs sem tud lemásolni anélkül, hogy az egész üzleti modelljét újraírná.