🔍 Versenytárs-elemzés — VibeVox
Utolsó frissítés: 2026-04-11 Forrás: STRATEGY.md + NotebookLM mélykutatás + CEE kvantitatív piacfelmérés + Accessibility CEE Market Analysis (2026-04-10) + Strategic Architecture and Market Analysis (2026-04-11) Cél: Minden belső döntéshozó számára — részletes referencia a piaci pozícionáláshoz. Accessibility integráció: ✅ GAP-4, 6 beépítve (2026-04-10) — Dragon NaturallySpeaking migráció + Beey.ai AT kockázat Strategic Architecture integráció: ✅ beépítve (2026-04-11) — SpeakLeash/Bielik CEE-natív STT monitoring szekció hozzáadva
Tartalomjegyzék
- Piaci kontextus — TAM, ARR, iparági dinamika
- Összefoglaló áttekintés
- Piaci szegmentáció
- Részletes versenytárs-profilok
- Összehasonlító táblázatok
- Churn-analízis — miért hagyják el a versenytársakat?
- VibeVox stratégiai pozícionálás
Piaci kontextus
Globális piacméret és benchmark ARR számok
Az AI-alapú hang-szöveg felismerés (STT) piac 2024–2026 között nemlineáris, robbanásszerű növekedésen ment át.
| Vállalat | ARR (becsült) | Felhasználók | Funding | Növekedés |
|---|---|---|---|---|
| Otter.ai | $100M+ | 35M+ | $63,5M VC | 56,3% YoY (2025) |
| Rev.com | $100M+ SaaS | Több százezer | Corporate | Stabil |
| Wispr Flow | $25M–$50M | 1M+ professzionális | $81M VC | 40% MoM (2025!) |
| Transkriptor | $15M–$30M | 1M+ | $0 (bootstrapped) | Organikus |
| Superwhisper | $2M–$5M | Több százezer MAU | $0 (bootstrapped) | 567% MAU növekedés (H1 2025) |
| MacWhisper | $1,5M–$3M+ | 385 000+ értékesítés | $0 (bootstrapped, LTD) | Bootstrapped |
| AquaVoice | Pre-revenue | Early adopter | $2,75M (YC S24) | Korai fázis |
Megjegyzés: A Wispr Flow $81M funding és 40%-os havi növekedése kivételes — ez éves szinten 5× szorzót jelent. Ugyanakkor ez VC-pénzzel finanszírozott growth hacking, nem organikus. A Transkriptor és MacWhisper bootstrapped módon érte el hasonló skálát — ez az üzleti modelljük jobb unit economics-ára utal. A VibeVox a bootstrapped versenytársakkal együtt bizonyítja: a BYOK modell VC funding nélkül is fenntartható.
CEE részpiac — a VibeVox célpiaca
| Szegmens | Méret | Forrás |
|---|---|---|
| CEE aktív Linux desktop user | ~1,58 millió (PL 919K, CZ 305K, HU 225K, SK 135K) | CEE kvantitatív kutatás (2026-04-07) |
| VibeVox SAM (fizetőképes szegmens) | ~364 320 (18% a text-heavy munkakörökből) | SAM/SOM modell |
| VibeVox SOM (18 hónap) | ~763–1 274 fizető user, MRR €5 340–€8 920 | SAM/SOM becslés |
| CEE szoftverfejlesztők | 1M+ | PL-ben ~300K egyedül |
| Globális Linux desktop arány | 4,44% (2024) → 4,70% (2025) | +70% növekedés 3 év alatt |
| Európai Linux arány | 5,21% (2025 csúcs) → 3,06% (2026 stabilizálódott) | — |
Win10 EOL migrációs lehetőség (2025 Q4–2026 Q2)
A Windows 10 támogatása 2025. októberben lejár. Ez egyszeri, 12–18 hónapos lehetőségi ablak, amelyet a VibeVox-nek aktívan ki kell használnia.
| Metric | Adat | Relevancia |
|---|---|---|
| Win10 aktív gépek (globális) | ~1,5 milliárd | Ebből CEE: százmilliók |
| CEE-ben nincs általános TPM 2.0 (Win10 gépek) | ~30–40% old hardware | Win11-re nem frissíthető |
| Versenytársak Win10 EOL kampánya | 0 (egyiknek sincs) | VibeVox elsőmóvers e szegmensben |
| Kulcsszavak | "windows 10 alternative linux" (~2000/hó) + "linux diktálás" | SEO targeting lehetőség |
A Win10 EOL migránsok linux-újoncként érkeznek, nem power user-ként. A Flatpak AppImage + egyszerű onboarding = alacsonyabb churn a meglévő Linux user-ekhez képest (tanulási görbéjük nincs még a platformhoz kötve).
Az iparági „Retention Crisis" (2026)
A B2C és SMB AI produktivitás piac 2026-ban retenció-válságot él át.
- Az AI-alapú appok fizetős előfizetőket 30%-kal gyorsabban veszítenek, mint a hagyományos szoftverek
- Éves retenció: csak 21,1%
- SMB szektorban: 30–58% éves churn az összegyűlő SaaS terhektől
- Havi churn: tipikusan 3–7%
- A BYOK-forradalom válasz erre: a tech-tudatos felhasználók saját API kulcsot használnak, filléres tényleges költséggel
Az iparág strukturális törésvonala
Cloud-native SaaS ↔ Lokális offline compute
(Wispr, Typeless, AquaVoice) (Superwhisper, MacWhisper, Voxtype)
─────────────────────────────────────────────────────────────────
LLM post-processing + kontextus Adat soha nem hagyja el a gépet
Privacy kockázat (screenshot, clipboard) Hardware-korlát (8 GB RAM = lag)
Folyamatos szerver-költség 100% gross margin, LTD lehetséges
CEE CEE-n gyengébb kis modellek CEE-n is gyengébb kis modellek
VibeVox pozíció: A kettő között + EU Frankfurt szerver = cloud minőség + EU adatvédelem, BYOK opció.
Összefoglaló áttekintés
Az AI-alapú diktáló szoftverek piaca 2026-ban éles törésvonal mentén oszlik meg: felhő-alapú SaaS eszközök (Wispr Flow, Typeless, AquaVoice) vs. lokális offline alkalmazások (Superwhisper, MacWhisper, Voxtype). A VibeVox (VibeVox) pozíciója egyedi: EU-hosted felhő + BYOK + natív OS-integráció + CEE lokalizáció — egy kombináció, amit jelenleg egyetlen versenytárs sem kínál.
Gyors referencia táblázat
| Versenytárs | Ár (havi) | LTD | BYOK | Platformok | Offline | CEE nyelv | Fenyegetés |
|---|---|---|---|---|---|---|---|
| Wispr Flow | $12–15 | ❌ | ❌ | Win, Mac, iOS, Android | ❌ | 🟡 Részleges | 🟡 Közepes |
| Typeless | $12 éves / $30 havi | ❌ | ❌ | Win, Mac, iOS, Android | ❌ | ✅ 100+ nyelv | 🔴 Magas |
| Superwhisper | $8,49 | $249,99 | 🟡 Pro-hoz kötött | Mac, iOS | ✅ | 🟡 Részleges | 🟢 Alacsony |
| MacWhisper | — | €269 | ✅ | Mac, iOS | ✅ | 🟡 Részleges | 🟢 Alacsony |
| Beey.ai | ~€5–25 | ❌ | ❌ | Web | ❌ | ✅ HU/SK/PL/CS | 🔴 Kritikus |
| AquaVoice | $8 (éves) | ❌ | ❌ | Win, Mac | ❌ | ❌ | 🟢 Alacsony |
| Spokenly | $9,99 | ❌ | ✅ Free tierben | Mac, iOS | ✅ | 🟡 Model-függő | 🟡 Közepes |
| Voxtype | Ingyenes | — | — | Linux | ✅ | 🟡 Model-függő | 🟡 Közepes |
| OpenWhispr | Ingyenes / $6,67 | ❌ | ✅ Free tierben | Win, Mac, Linux | ✅ | 🟡 Model-függő | 🟡 Közepes |
| Transkriptor | $9,99–19,99 | ❌ | ❌ | Web | ❌ | ✅ 100+ nyelv | 🟡 Közepes |
| Newton Dictate | Legacy lic. | — | ❌ | Win | ✅ | ✅ SK/CS | 🟡 Közepes |
| AudioPen | ~$8,25 éves | ❌ | ❌ | Web, iOS, Android | ❌ | 🟡 | 🟢 Alacsony |
| Voicenotes | $9,99 | ❌ | ❌ | Összes | ❌ | 🟡 | 🟢 Alacsony |
| Otter.ai | $8–30 | ❌ | ❌ | Web, iOS, Android | ❌ | ❌ CEE | 🟢 Alacsony |
| Gboard | Ingyenes | — | — | Android | 🟡 Hibrid | ❌ CEE bugos | 🟡 Közepes |
| VoiceIn | Ingyenes / ~$2 | ❌ | ❌ | CWS csak | ❌ | 🟡 50+ nyelv | 🟡 Közepes (top-of-funnel) |
| Speechnotes | Ingyenes / ~$8 | ❌ | ❌ | CWS + Web | ❌ | 🟡 Google Speech | 🟡 Közepes (top-of-funnel) |
| VibeType | N/A (korai fázis) | — | ✅ Lokális | Mac (korai) | ✅ | ❌ | 🟡 Közepes (dev szegmens) |
| VibeScribe | N/A (korai fázis) | — | ❌ | Mac | ✅ | ❌ | 🟢 Alacsony |
| Dictly | N/A (korai fázis) | — | — | Mac, iOS | ✅ | ❌ | 🟢 Alacsony |
| VoxTap | N/A (korai fázis) | — | — | Mac | ✅ | ❌ | 🟢 Alacsony |
Piaci szegmentáció
A versenytársak három fő szegmensbe sorolhatók:
1. Valós idejű, rendszerszintű diktálás (közvetlen versenytársak)
Ezek az alkalmazások globális hotkey-vel aktiválhatók, és bármely szövegmezőbe beírják a szöveget — pontosan az, amit a VibeVox csinál.
| Versenytárs | Architektúra | Fő erősség | Fő gyengeség |
|---|---|---|---|
| Wispr Flow | Cloud SaaS, Electron | Kontextus-érzékeny formázás, 1M+ user | Privacy nightmare, 800 MB RAM |
| Typeless | Cloud SaaS | MrBeast marketing, Speak-to-Edit | Clipboard scraping, 6 perc cap |
| AquaVoice | Cloud SaaS, saját modell | Sub-second latency (Avalon) | Nincs Linux, nincs BYOK, nincs LTD |
| Superwhisper | Lokális, Apple Silicon | 100% offline privacy, 567% MAU növ. | Csak macOS/iOS, drága LTD |
| MacWhisper | Lokális, Apple Silicon | BYOK támogatás, MDM, 385K értékesítés | Csak macOS, memory swapping |
| Spokenly | Lokális + BYOK cloud | Ingyenes offline + BYOK, MCP szerver | Csak Apple (macOS/iOS) |
| Voxtype | Lokális, Rust | 7 engine, Wayland natív | Csak Linux, nincs SaaS |
| OpenWhispr | Hibrid (lokális+cloud) | BYOK free tier, Linux first-class | Electron, kis user base |
2. Aszinkron transzkripció (indirekt versenytársak)
Ezek nem valós idejű diktáló eszközök — fájl-feltöltéssel működnek, de a CEE piacon konkurálnak a felhasználók figyelméért.
| Versenytárs | Típus | CEE relevancia |
|---|---|---|
| Beey.ai | Fájl-upload → transzkripció | 🔴 50K+ CEE user, tuned modellek, Newton háttér |
| Transkriptor | Fájl-upload → transzkripció | 🟡 1M+ user, $15–30M ARR, EU-hosted, 100+ nyelv |
| Otter.ai | Meeting transzkripció | 🟢 $100M+ ARR, de nincs CEE nyelv, US szerveren |
3. Hangmemo-feldolgozók (távolabbi verseny)
Ezek nem globális diktálás, hanem „gondolat → szöveg" transzformáció saját felületen belül.
| Versenytárs | Típus | Pozíció |
|---|---|---|
| AudioPen | Hangmemo → szerkesztett szöveg | „Unstructured thought processor" |
| Voicenotes | Hangmemo → AI elemzés | „Második agy" / note-taking, watchOS/WearOS is |
4. Böngésző-alapú CWS diktáló extensionok (top-of-funnel versenytársak)
Ezek Chrome Web Store-on terjesztett, browser-sandboxéd diktálók. Nem rendszerszintűek — csak a böngésző belső szovöegmezőibe írnak (Gmail, Google Docs, Notion). A VibeVox-vel szemben az az egyetlen értékék, hogy 0 telepítéssel indulás előtt használhatók — ez teszi őket top-of-funnel környezetben veszedelmessé.
| Versenytárs | Felhasználók | CEE relevancia |
|---|---|---|
| VoiceIn | 800 000+ | 🔴 Népszerű légügyisékény a CEE-ben, ingyenes, 50+ nyelv |
| Speechnotes | 3 000 000+ | 🟡 A legismértebb böngészős diktáló — de csak Google Docs használatban erős |
Részletes versenytárs-profilok
1. Wispr Flow
Státusz: VC-funded ($81M), cross-platform, cloud SaaS Becsült ARR: $25M–$50M | Felhasználók: 1M+ | Növekedés: 40% MoM Fenyegetési szint: 🟡 Közepes — tud magyarul, de a privacy-botrány és az Electron bloat elbizonytalanítja a CEE tech felhasználókat.
Finanszírozás és cégháttér
| Adat | Érték |
|---|---|
| Összes VC tőke | $81 millió |
| Legutolsó kör | $25M Series A extension — 2025. november |
| Lead investor | Notable Capital |
| Részt vevő | Flight Fund (Steven Bartlett vállalkozó befektetési kara) |
| Stratégiai cél | Saját fejlesztésű hangmodellek → „Voice Operating System" |
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | 2000 szó/hét | Korlátozott |
| Pro | $12–15/hó ($144/év) | Egyetlen fizetős tier |
| LTD | ❌ Nincs | SaaS-only modell |
| BYOK | ❌ Tiltott | Zárt ökoszisztéma |
Architektúra és funkciók
- Intelligens formázás: Automatikus filler word eltávolítás, ismétlődő kifejezések törlése, listák strukturálása
- Dinamikus tónus-váltás: Formális / közvetlen / nagyon közvetlen stílus automatikus alkalmazása az aktív alkalmazás alapján
- Fejlesztői integráció: Cursor IDE kompatibilitás, lokális változónevek és fájlreferenciák felismerése
- Cross-platform: Mac, Windows, iOS, Android
Privacy problémák — „Screenshot Privacy Nightmare"
A Wispr Flow kontextus-érzékenységének ára rendkívül magas:
- Folyamatos screenshot capture: Az alkalmazás folyamatosan képernyőképeket készít az aktív ablakról
- Adat továbbítás: A screenshotok + titkosítatlan hangfelvételek harmadik féltől származó felhőszerverekre kerülnek (OpenAI, Meta)
- NDA-kötött felhasználók: Ügyvédek, orvosok, és titkosított projekten dolgozó fejlesztők számára ez azonnali törlést eredményez
Erőforrás-fogyasztás (Electron)
| Metrika | Mért érték | Összehasonlítás VibeVox-vel |
|---|---|---|
| RAM (idle) | ~800 MB | VibeVox: ~150 MB (aktív diktálás) |
| CPU (idle) | 8–13% | VibeVox: ~0% |
| „Jet Engine" effektus | ✅ Folyamatos ventilátorzaj | VibeVox: nincs |
| Windows stabilitás | ⚠️ Crashek, Word/VSCode fagyás | VibeVox: natív, stabil |
Churn okok
- Szemantikai inverzió: Az agresszív auto-formázás megváltoztatja a user szándékát, egész mondatokat töröl „felesleges" szövegként
- Hallucinációk csendben: Csend vagy háttérzaj esetén a modell random szövegeket illeszt be: „Transcription by CastingWords", „Thanks for watching", idegen nyelvű mondatok
- Cloud latency: 1,5–3 másodperces round-trip — flow state megszakítás
- Subscription fatigue: „A billentyűzet SaaS-ifikálása" — $15/hó egy billentyűzet-kiegészítőért
2. Typeless
Státusz: Cross-platform SaaS, MrBeast endorsement, agresszív affiliate program Fenyegetési szint: 🔴 Magas — 100+ nyelv, 8000 szó/hét free tier, erős brand awareness
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | 8000 szó/hét | Nagyon bőkezű — konverziós gate |
| Pro éves | $12/hó ($144/év) | — |
| Pro havi | $30/hó | — |
| LTD | ❌ Nincs | — |
| BYOK | ❌ Tiltott | — |
Funkciók
- 220 szó/perc diktálási sebesség — cloud-alapú, gyors
- Speak to Edit: Kijelölhető szöveg weboldalon vagy dokumentumban, hangutasítással összefoglalható/bővíthető/átírható — AI ágensként működik
- 100+ nyelv automatikus felismeréssel és fordítással
- 6 perces session limit — minőségbiztosítás és margin-védelem (VibeVox-nél is 6 perc)
MrBeast endorsement
A Typeless marketingje egyedülállóan agresszív: MrBeast (Jimmy Donaldson) csapata egy „lakatlan sziget" produkcióban használta az alkalmazást, ahol gépelés helyett kizárólag hangalapú üzeneteket küldtek. Ez a mainstream disztribúciós csatorna több százmilliós elérést biztosított.
Kontextus: A Beast Industries (MrBeast holdingtársasága) ugyanekkor zárt $450M-os finanszírozási kört — ez nem a Typeless tőkéje, de a brand asszociáció rendkívül erős.
Affiliate program — az iparági benchmark
- 25% recurring (élethosszig tartó) revenue share
- Kifizetés: PayPal vagy Stripe Connect
- Az „iparági Typeless-modell" — YouTuberek és bloggerek passzív jövedelemforrása
- A VibeVox ugyanezt a 25%-os modellt alkalmazza: Stripe + Rewardful (20+ affiliate felett); launch előtt manuális UTM-alapú tracking (Google Sheets + Wise utalás)
Privacy problémák
A „Zero Data Retention" ellenére (a hang feldolgozás után törlődik, nem használják modell-tréningre):
| Probléma | Részlet |
|---|---|
| Clipboard scraping | Jelszókezelőkből is olvas átmeneti adatot |
| DOM olvasás | Böngésző tartalmat olvas (URL-ek, weboldalak) |
| Billentyűleütés figyelés | macOS CGEventTap rendszerszintű hooking |
| Geografikus hallucináció | IP-cím alapján helyi szlenget erőltet formális szövegbe |
Churn okok
- Vállalati kill: NDA-kötött és GDPR-kompatibilis környezetben a clipboard/DOM scraping = azonnali, végleges törlés
- Subscription exhaustion: $144/év + 6 perces cap + privacy-aggodalmak → a user úgy érzi, „bérli a saját produktivitását"
- BYOK hiány: A felhasználók tudják, hogy az API költség filléres — mégis $12-t fizetnek havonta
⚠️ Kihasználható sebezhetőségek — VibeVox „True Zero Access" differenciátor
A Typeless „Zero Data Retention" ellenére az alábbi rendszerszintű adathozzáférési sebezhetőségek a VibeVox legerősebb marketing fegyverei a cybersec közösségben (P1 affiliate pillér).
| Sebezhetőség | Hatás | VibeVox válasz |
|---|---|---|
| Clipboard scraping (jelszavak is!) | Enterprise security blocker — password manager adatok kiszivárgása | Hold-to-talk: 0 clipboard hozzáférés |
| Browser DOM element olvasás | NDA-kötött dokumentumok, ügyvédi kommunikáció kiszivárgása | Natív app: 0 browser hozzáférés |
| URL tracking | Böngészési szokások feltérképezése — privacy sértés | 0 URL tracking |
| IP-alapú geographic profiling | Kényszerített szleng → technikai dokumentációnál katasztrofális | VibeVox: nyelvi profil = user explicit választása |
| 6 perces session limit | Flow state megszakítás | VibeVox: szintén 6 perc (margin védelem), de hold-to-talk = természetes szünet |
Marketing narratíva: NEM „Zero Retention" hanem „True Zero Access" — mert a VibeVox-nek nincs mihez hozzáférnie (sem clipboard, sem DOM, sem URL, sem screen).
Content formátumok (P1 cybersec pillér):
- Blog: „Typeless reads your clipboard — even your passwords"
- Twitter thread: Side-by-side Typeless permissions vs. VibeVox (0 permissions)
- Technikai teardown: Mátrix összehasonlítás (P1 affiliate-eknek)
A Typeless geo profiling probléma KÜLÖNÖSEN releváns a CEE fejlesztőknek: ha az IP cím alapján kényszerített szleng kerül a transzkripciókba, az technikai dokumentációnál katasztrofális. Ez kiváló content angle.
3. Superwhisper
Státusz: Bootstrapped (Y Combinator alumnus Neil Chudleigh), Apple only, offline-first Becsült ARR: $2M–$5M | Növekedés: 567% MAU (H1 2025) Fenyegetési szint: 🟢 Alacsony — csak macOS/iOS, CEE Windows/Linux userek nem érintettek
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | Korlátozott | — |
| Pro havi | $8,49/hó | — |
| Pro éves | $84,99/év | — |
| LTD | $249,99 | Egyetlen fizetés, örökre |
| BYOK | 🟡 Pro előfizetéshez kötött | Fizetni kell a Pro-ért, hogy BYOK-ot használhass — dupla kifizetés |
Architektúra és az Argmax Parakeet model
- 100% offline: Whisper, NVIDIA Parakeet (Argmax implementáció), egyéb modellek lokálisan futnak az Apple Neural Engine-en
- 567%-os MAU növekedés: Az Argmax Parakeet-re való migráció után (H1 2025) — ez az élcsúcs-modell-váltás tette robbanásszerűvé
- Zero data transfer: A hangfelvétel soha nem hagyja el a gépet → GDPR-mentesít
- Modell-cserélhetőség: A user letöltheti és váltogathatja a különböző AI modelleket
- Custom prompting: A nyers szöveg automatikus formázása beillesztés előtt — egyedi utasítások alapján
Fő korlátok
| Korlát | Hatás |
|---|---|
| Csak Apple | Windows/Linux felhasználók kizárva |
| 8 GB RAM MacBookon | Memory swapping, OS lag, crash esetek |
| $249,99 LTD | Költségérzékeny CEE SMB-knek túl drága |
| BYOK gate | Pro előfizet szükséges a BYOK-hoz |
| Nincs app-kontextus felismerés | A dinamikus tónus-váltás (mint Wispr/Typeless-nél) nincs — manuális prompt kell |
4. MacWhisper
Státusz: Bootstrapped (Jordi Bruin), Apple only, duális disztribúció Becsült ARR: $1,5M–$3M+ | Értékesítések: 385 000+ Fenyegetési szint: 🟢 Alacsony — csak macOS, de a BYOK támogatás és az MDM integráció erős vállalati pozíciót ad
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | Alap funkciók | App Store verzió |
| Pro LTD | €269 | Gumroad közvetlen letöltés |
| BYOK | ✅ Szabad, díjmentesen | iOS-en és macOS-en is |
Megjegyzés: MacWhisper elsősorban LTD-alapú monetizáció — az $1,5M–$3M+ bevétel döntően egyszeri élethosszig érvényes vásárlásokból áll, nem recurring subscription-ből. Ez 100% gross margint jelent (nincs szerver-költség).
Duális disztribúció
- App Store verzió („Whisper Transcription"): Sandboxed, korlátozott rendszer-hozzáférés
- Gumroad verzió („MacWhisper"): Nem sandboxed — globális diktálás bármely szövegmezőbe, naptári meeting-észlelés, MDM vállalati telepítés
Fő funkciók
- Batch processing (több fájl egyidejű feldolgozása) — újságírók, videószerkesztők kedvence
- Felirat-generálás
- MDM (Mobile Device Management) támogatás — vállalati IT részlegek számára
- Apple Neural Engine gyorsítás
- Automatikus calendar meeting detection (Gumroad verzió)
Hardware korlátok
| Konfiguráció | Élmény |
|---|---|
| M1/M2/M3 + 16 GB RAM | ✅ Fluid, valós idejű |
| M1/M2 + 8 GB RAM | ⚠️ Memory swapping, lag |
| Intel Mac | ❌ Gyakorlatilag használhatatlan large-v3-mal |
5. Beey.io (Newton Technologies)
Fejlesztő: Newton Technologies (ugyanaz a cég, mint a Newton Dictate fejlesztője) Felhasználók: 50,000+ CEE felhasználó Státusz: Prágai székhelyű, erős vállalati háttér Fenyegetési szint: 🔴 KONDICIONÁLIS — jelenleg NEM közvetlen versenytárs (aszinkron ≠ real-time diktáló), de ha real-time modult fejlesztenek, azonnali fenyegetés
Kulcsdifferenciáció (kutatás-validált, 2026-04-07): A Beey.io aszinkron transzkripciós eszköz — pre-recorded fájlok (videó, audio) feltöltése a web portálra → szerkeszthető átirat + felirat. NEM valós idejű OS-level diktálás. Nem injektál szöveget nyitott alkalmazásba (Praetor, mMedica, stb.). Ez a VibeVox legfontosabb differenciátora ellene.
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Pay-as-you-go | 0,14 EUR/perc | Kreditrendszer |
| Alap | ~€5/hó | 2 óra feldolgozás |
| Standard | ~€25/hó | 5 óra feldolgozás |
| LTD | ❌ | — |
| BYOK | ❌ | — |
Architektúra és funkciók
- Kizárólag aszinkron transzkripció: Web portálon feltöltött audio/videó → szerkeszthető átirat/felirat — nincs real-time mód
- Nem OS-level eszköz: Nem injektál szöveget nyitott alkalmazásokba; a felhasználónak copy-paste-tel kell átvinni az EHR/jogi rendszerbe
- Tuned CEE modellek: Regionális egyetemekkel közösen fejlesztett, lokalizált neurális felismerő modellek — HU/SK/PL/CS dialektusokra finomhangolva
- Célszektor: Média, jog (meeting transzkripció), közigazgatás (archivált felvételek)
Aszinkron vs. Real-Time — a kritikus különbség
| Workflow | Beey.io | VibeVox |
|---|---|---|
| Felvétel → szöveg (utólag) | ✅ (feltöltés + feldolgozás) | ✅ (real-time, <1 mp) |
| Élő diktálás EHR-be | ❌ Nem képes | ✅ OS-level injection |
| Diktálás vizit/tárgyalás közben | ❌ Nem képes (aszinkron) | ✅ Hold-to-talk, instant inject |
| Praetor/Kleos/mMedica-ba injektál | ❌ Nem képes | ✅ Bármely alkalmazásba |
| VDI/Citrix kompatibilis | ❌ Audio routing probléma | ✅ Helyi OS-en fut |
Sales angle: „Ha Beey.io-t használnak meeting-ek utólagos transzkripciójához, maradhat — a VibeVox a napi élő diktálást oldja meg. Egymást kiegészítik, nem helyettesítik."
Miért potenciálisan kritikus fenyegetés (ha változna)?
| Faktor | Részlet |
|---|---|
| 50K+ aktív CEE user | Már bizonyított piaci elfogadottság — meglévő user base |
| Tuned CEE modellek | Jobb CEE nyelvi minőség, mint a generikus Whisper |
| Newton Technologies háttér | Erős vállalati erőforrás (Newton Dictate fejlesztője) |
| Hiányzó real-time | JELENLEG nem valós idejű diktálás → VibeVox előnye |
| Bővülési kockázat | Ha real-time modult fejlesztenek, azonnali CEE versenytárs |
VibeVox védelmi stratégia
| # | Védelmi pillér | Részlet |
|---|---|---|
| 1 | Workflow differenciáció | Beey.io = meeting-archív eszköz; VibeVox = live input tool — különböző use case-ek |
| 2 | Időbeli előny | Amíg aszinkron marad, a VibeVox monopolizálja a real-time CEE piacot |
| 3 | Linux lock-in | Beey.io webes → VibeVox natív = developer és IT MSP lojalitás |
| 4 | BYOK differenciátor | Beey.io nem kínál BYOK-ot → VibeVox az egyetlen „sovereignty" opció |
| 5 | AT csatorna kockázat (GAP-6) ✅ | Newton Technologies archív intézményi kapcsolatok — ha Beey AT-csatornába lép (PFRON/Infoalap/klinikai bázék), a VibeVox-nek fel kell gyorsítani a direkt partnerségépítést |
Negyedéves monitoring protokoll: Ellenőrizni a beey.io roadmap-ot, blog-ot és LinkedIn-posztokat real-time feature bejelentésekre. Ha real-time diktálást indítanak, azonnali versenystratégia-felülvizsgálat szükséges (positioning, árazás, CEE marketing differenciálás). AT csatorna monitoring (GAP-6): Newton Technologies archív intézményi kapcsolatai (PFRON-PL, klinikai AT, Infoalap-HU) kockázatot jelentenek. Ha Beey AT-csatornába lép, a VibeVox-nek gyorsan be kell erősíteni a PFRON/Infoalap direkt partnerséget.
6. AquaVoice
Státusz: Cloud SaaS, saját „Avalon" modell, fejlesztő-fókusz Fenyegetési szint: 🟢 Alacsony — nincs Linux, nincs BYOK, nincs LTD, nincs CEE lokalizáció
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | 1000 szó (egyszeri!) | Rendkívül korlátozott |
| Pro | $8/hó (éves: $96/év) | Kizárólag éves fizetés |
| Akadémiai | 70% kedvezmény | .edu emailhez kötött |
| LTD | ❌ | — |
| BYOK | ❌ Tiltott | — |
Saját „Avalon" modell
- Sub-second latency: 450ms – 1 másodperc válaszidő
- Technikai jargon: 0,9% szó-szintű hibaarány corporate emaileknél
- CLI kompatibilitás: Képes parancssori utasításokat és kódrészleteket pontosan átírni
Kritikus hibák
| Hiba | Hatás |
|---|---|
| Cloud-only | Air-gapped vállalati környezetben használhatatlan |
| Hallucinated suffixek | Diktálások végére „bye", „thank you" szövegeket illeszt |
| Formázási merevség | Struktúrálatlan szövegfal, kézi prompt szükséges |
| Nincs Linux | A CEE fejlesztő szegmens (~1,58M user) kiesik |
| Nincs BYOK | Zárt ökoszisztéma — subscription fatigue |
7. Spokenly
Státusz: Apple-only, BYOK-first, MCP szerveres fejlesztői integráció Fenyegetési szint: 🟡 Közepes — erős BYOK propozíció, de csak macOS/iOS
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | Korlátlan offline + BYOK cloud | Korlátlan ingyenes BYOK — erős kompetitív fegyver |
| Pro | $9,99/hó | Managed cloud, API kulcs nélkül |
| LTD | ❌ | — |
Architektúra és egyedi funkciók
- Ingyenes korlátlan offline + BYOK: Az egyetlen alkalmazás, ami mindkettőt ingyen adja — erős Superwhisper-alternatíva fejlesztőknek
- MCP szerver integráció: Direkt interfész Claude Code és más AI coding agenssel — a fejlesztők hangon vezérelhetik az IDE-jüket
- Agent Mode: Interaktív AI overlay az aktuális képernyőre
Korlátok
| Korlát | Hatás |
|---|---|
| Csak Apple (macOS/iOS) | A Windows/Linux user base teljesen kiesik — ez a fő gyengesége |
| Ingyenes BYOK = nincs bevétel | Üzleti fenntarthatóság kérdéses hosszú távon |
| Nincs CEE lokalizáció | — |
VibeVox vs. Spokenly: A Spokenly Apple-exkluzivitása teszi őt nem direktum fenyegetéssé a CEE Windows/Linux piacunkon. De a BYOK-stratégiájuk és az MCP integráció figyelemre méltó — a fejlesztői szegmens felé ez erős üzenet.
8. Voxtype
Státusz: Open-source, Rust, Linux-natív, 100% offline Fenyegetési szint: 🟡 Közepes — egyetlen valódi Linux-natív versenytárs, de nincs SaaS / lokalizáció
Árazás és licenc
| Terv | Ár |
|---|---|
| Teljes | Ingyenes (open-source) |
Architektúra
- Rust implementáció: Minimális rendszerterhelés, push-to-talk daemon
- 7 transzkripciós engine: Whisper, Parakeet, Moonshine, SenseVoice, Paraformer, Dolphin, whisper.cpp
- GPU gyorsítás: Beépített Vulkan és CUDA support
- 100% offline: Alapértelmezetten minden feldolgozás lokálisan
Wayland kompatibilitás — szöveg-beillesztési lánc
A Voxtype a legfejlettebb Linux szöveg-beillesztési megoldással rendelkezik:
1. wtype → Wayland natív (UTF-8, CJK kezelés)
2. eitype → GNOME/KDE libei protokoll (fallback)
3. dotool → Kernel-szintű input szimuláció (fallback)
4. ydotool → Általános input szimuláció (fallback)
5. clipboard → Utolsó mentsvár
- Hyprland, Sway, River tiling WM natív támogatás
- Waybar integráció (statusbar widget)
Fő korlátok
| Korlát | Hatás |
|---|---|
| Csak Linux | Windows/Mac/Android felhasználók kizárva |
| Nincs SaaS modell | Nincs bevétel → fenntarthatóság kérdéses |
| Nincs CEE lokalizáció | A UI/UX nincs magyarra, szlovákra, stb. fordítva |
| Offline CEE minőség | Kis modellek CEE-n word salad → ld. Offline Whisper elemzés |
9. OpenWhispr
Státusz: Open-source, Electron, multi-platform, BYOK-first Fenyegetési szint: 🟡 Közepes — az egyetlen BYOK-natív, Linux-first alkalmazás (AppImage, DEB, RPM)
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free + BYOK | Ingyenes | Korlátlan transzkripció saját API kulccsal |
| Pro | $6,67/hó ($80/év) | Managed cloud + prémium funkciók |
Funkciók
- Linux first-class citizen: AppImage, DEB, RPM disztribúció — az egyedüli, ami Linuxot elsődleges platformként kezeli
- Hibrid architektúra: Offline Whisper/Parakeet + cloud BYOK
- Wayland natív támogatás: GNOME keyboard shortcuts D-Bus-on, persistent clipboard ownership — megbízható beillesztés
- 100+ nyelv out of the box
- Agent Mode: AI overlay az aktuális képernyőre, streaming AI válaszok
- Meeting detection + live transcription automatikus
- Automated meeting transcription és élő diktálás egyszerre
Korlátok
- Electron: Magasabb RAM-fogyasztás a natív alkalmazásokhoz képest
- Kis felhasználói bázis: Nincs jelentős piaci penetráció
- Nincs CEE lokalizáció
Stratégiai válasz (VibeVox vs OpenWhispr)
| Dimenzió | OpenWhispr | VibeVox |
|---|---|---|
| Architektúra | Electron (~300–500MB RAM) | PySide6 natív (<100MB RAM) |
| Árazás | Free core + $6,67/hó Pro | Free 180 perc + €9,99/hó Pro |
| BYOK | ✅ Free tier-en is korlátlan | ✅ €3,50/hó |
| Linux csomag | AppImage, DEB, RPM | AppImage (kész), Flatpak/Flathub (F1) |
| CEE filler removal | ❌ | ✅ HU/SK/PL/CS |
| GDPR compliance csomag | ❌ | ✅ DPA, MVCS, EU képviselő |
| Flathub jelenlét | ❌ | ✅ Fázis 1 (discovery előny) |
| LTD | N/A (open-source = örökre ingyenes) | BYOK €79 LTD |
VibeVox fő fegyverei OpenWhispr-rel szemben:
- RAM benchmark publikálás: PySide6 ~80MB vs Electron ~300-500MB — virális a Linux dev közösségben
- CEE lokalizáció: OpenWhispr nem kínál filler word eltávolítást (ööö, hát, szóval)
- Compliance csomag: OpenWhispr-nek nincs DPA, MVCS, EU képviselő — B2B-ben diszkvalifikálja magát
- Flathub prioritás: OpenWhispr nincs Flathub-on — a VibeVox Flathub jelenlét GNOME Software/KDE Discover discovery előny
10. Transkriptor
Státusz: Bootstrapped, EU-hosted, aszinkron transzkripció Becsült ARR: $15M–$30M | Felhasználók: 1M+ Fenyegetési szint: 🟡 Közepes — nem valós idejű, de erős CEE nyelvi támogatás és EU compliance
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Lite | $9,99/hó | Alap, ~300 perc/hó |
| Pro | $19,99/hó | 2400 perc/hó |
| Enterprise | Egyedi | — |
Funkciók és pozíció
- High-volume fájl-upload: Meeting transzkripció, felirat-generálás
- 100% EU-hosted infrastruktúra: GDPR és Schrems II teljes megfelelés — auditable Data Processing Agreement-ekkel
- 100+ nyelv — akár 99%-os pontosság HU/PL/SK nyelveknél (Whisper-alapú)
- NEM valós idejű diktálás — fájl-alapú workflow
Megjegyzés: A Transkriptor $15–30M ARR-t ért el VC-pénz nélkül — ez azt bizonyítja, hogy a CEE-kompatibilis EU-hosted transzkripció piaca valóban fizető. A VibeVox-nek azonban eltérő a propozíciója: real-time, OS-szintű diktálás vs. aszinkron fájl-feldolgozás.
11. Newton Dictate
Státusz: Legacy, Newton Technologies (= Beey.ai anyacég), SK/CZ jogi szektor Fenyegetési szint: 🟡 Közepes — beágyazott pozíció a szlovák/cseh jogi szektorban
Árazás
- Legacy licencel modell — gyakran speciális hardver (Philips SpeechMike, Sennheiser headset) szükséges
- Drága belépési küszöb (hardver + szoftver licenc együtt)
Funkciók
- Real-time diktálás közvetlenül harmadik féltől származó alkalmazásokba
- Kurátált szakmai szótárak: Szláv jogi és orvosi terminológia
- Régebbi generációs akusztikai modellek — korszerűtlen a modern AI eszközökhöz képest
- SK/CZ jogi szektorban domináns — erős lock-in
12. AudioPen
Státusz: Web/iOS/Android, hangmemo-feldolgozó (NEM valós idejű diktálás) Fenyegetési szint: 🟢 Alacsony — eltérő use case
Árazás
| Terv | Ár |
|---|---|
| Free | Korlátozott |
| Prime | $99/év (~$8,25/hó) |
| LTD | ❌ Megszűntetve (korábban $29–120) |
Pozíció
- „Unstructured thought processor": A user speaking, az LLM radikálisan átírja, összefoglalja, strukturálja a szöveget
- NEM globális diktálás: Nem ír közvetlenül az aktív alkalmazásba
- Web, iOS, Android, Chrome bővítmény
13. Voicenotes
Státusz: Minden platformon elérhető hangmemo AI hub Fenyegetési szint: 🟢 Alacsony — eltérő use case
Árazás
| Terv | Ár |
|---|---|
| Free | Korlátozott |
| Pro | $9,99/hó vagy $99,99/év |
| LTD „Believer Plan" | ❌ Megszűntetve (első 1000 user — növekvő AI infra-költség miatt zárták le) |
Pozíció
- „AI második agy": Hosszú meetingek rögzítése, összefoglalók, action itemek, „Ask AI" korábbi jegyzetek lekérdezése
- Minden platformon: Mac, Windows, Web, iOS, Android, watchOS, WearOS is
- NEM rendszerszintű diktálás — kizárólag saját felületen belül
14. Otter.ai
Státusz: VC-funded enterprise meeting intelligence, 35M+ user, $100M+ ARR Fenyegetési szint: 🟢 Alacsony CEE-ben — nincs CEE nyelv, US szerveren fut
Árazás
| Terv | Ár |
|---|---|
| Free | Korlátozott |
| Pro | $8–16/hó |
| Business | $20–30/hó |
Funkciók
- Meeting intelligence: Zoom, Google Meet, MS Teams beágyazott „AI Meeting Agent"
- 35M+ felhasználó, $100M+ éves bevétel, 56,3% YoY növekedés (2025)
- Sales pipeline automatizálás korábbi meeting adatok alapján
Kritikus CEE korlátok
| Korlát | Hatás |
|---|---|
| US-alapú AWS szerveren | GDPR/Schrems II kockázat EU vállalatok számára |
| Nincs CEE nyelv | Csak angol, spanyol, francia, japán |
| Nem valós idejű diktálás | Meeting-specifikus, nem rendszerszintű |
15. Google Gboard (Android beépített)
Státusz: A legelterjedtebb Android billentyűzet — ingyenes, előtelepített Fenyegetési szint: 🟡 Közepes — mindenkinél ott van, de a CEE nyelveken katasztrofálisan rosszul teljesít
A „Word Salad" Bug — miért rossz CEE-n?
A Gboard agresszív hibrid feldolgozási architektúrát használ:
1. Könnyű offline modell → azonnali, de hibás tipp
2. Közben cloud-ra streamel → pontosabb eredmény
3. A két eredmény ütközik → a szöveg újraírja magát
→ egész tagmondatok törlődnek → "word salad" kimenet
Specifikus CEE problémák
| Probléma | Részlet |
|---|---|
| Szöveg-újraírás | A flektáló CEE nyelvek kontextusfüggő ragozását a kis offline modell rosszul találja el → a cloud javítása a már beírt szöveget felülírja |
| Írásjel-normalizálás | „kropka" (lengyel pont) mondásakor a tulajdonnév kisbetűsre vált → „Spotkajmy się w warszawa." |
| Offline failure | Hálózat kikapcsolásakor a Gboard az „inicializálás" állapotban ragad — súlyos offline marketing-hazugság |
| Szakkifejezések | A Personal Dictionary-t figyelmen kívül hagyja diktáláskor — jargon → tömeg-alternatívára javít |
VibeVox válasz a Gboard problémára
A VibeVox Android MVP kizárólag cloud-alapú pipeline-t használ (Groq Whisper Large v3, Frankfurt szerver):
- A teljes mondatot holisztikusan dolgozza fel — nem szó-szintű streamelés
- A kimondott CEE írásjel-parancsokat a backendon interceptálja, tipográfiai szimbólumra cseréli a normalizálás előtt
- Nincs hibrid ütközés → nincs word salad
16. VoiceIn (Chrome Web Store)
Státusz: CWS extension, 800 000+ aktív felhasználó, böngésző-only Fenyegetési szint: 🟡 Közepes — top-of-funnel alternatíva a lazy usereknek, de nem rendszerszintű
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | Korlátlan | ❌ Régi Manifest V2 API-t használt, MV3 migració folyamatban |
| Plus | ~$2/hó | Filler word removal, custom vocabulary |
| LTD | ❌ | — |
| BYOK | ❌ | Csak a VoiceIn felhőjét használja |
Architektúra és korlátok
- Csak Chrome/Chromium böngészőben működik — nincs Firefox, nincs natív app
- Csak böngésző szövegmezőkbe ír — nem működik VS Code, Word, Excel, Slack (desktop) vagy bármely natív alkalmazásban
- MV3 korlátok: Service Worker timeout, Offscreen Document latencia 200–700ms → „aha-pillanat" nem jön el
- Nincs hold-to-talk: Push-to-talk gombot kell kattintani a böngészőben — nem globális hotkey
- Adatvédelem: A hang a VoiceIn felhőjére kerül (nem EU-hosted, nincs GDPR certificáció)
| Korlát | Hatás |
|---|---|
| Browser-only | Kizárja a teljes non-browser workflow-t (IDE, EHR, CRM, Word) |
| Service Worker timeout | Hosszú diktálás megszakad 5 perc után |
| Audio latencia | 200–700ms → 3-4× lassabb, mint VibeVox (~1 sec teljes pipeline-nal) |
| CEE filler removal | ❌ Free tierben nincs; Plus-ban is inkonzisztens |
| GDPR megfelelés | ❌ Nem EU-hosted, nincs DPA |
VibeVox vs. VoiceIn — stratégiai pozíció
A VoiceIn felhasználói a legfőbb átváltdandó szegmens: már akarnak diktálni, már kipróbálták — de a browser korlát frustrálja őket (nem működik Wordban, Slackban, az IDE-ben). A VibeVox Chrome Extension companion (Fázis 2b) pontosan ezt a frustáráltált szegmenst célozza meg CWS-en.
Marketing angle (CWS landing + Extension Popup):
„VoiceIn csak a böngészőben diktál. A VibeVox bárhol — Wordban, VS Code-ban, Excelben, Slackban. Egyszeri telepítés, örök szabadság."
17. Speechnotes (Chrome Web Store)
Státusz: CWS extension + web app, 3 000 000+ felhasználó, notebook/Google Docs fókusz Fenyegetési szint: 🟡 Közepes — a legelterjedtebb böngészős diktáló, de kizárólag online
Árazás
| Terv | Ár | Megjegyzés |
|---|---|---|
| Free | Korlátlan alap | Google Cloud Speech API-val (nem Whisper) |
| Premium | ~$8/hó | AI szöveggeneráció, export funkciók |
| LTD | ❌ | — |
| BYOK | ❌ | — |
Architektúra és korlátok
- Google Cloud Speech API (nem Whisper) — CEE morfológiai korlátok: HU/SK körülírásos előtagok, szenvedő szerkezetek hibásan
- Csak online: Nincs offline mód — internet nélkül teljesen használhatatlan
- Saját note editor felület: NEM rendszerszintű injekció — a szöveget még copy-paste-elni kell
- 3M+ felhasználó — de ebből a CEE szegmens elhanyagolható része fizető
| Korlát | Hatás |
|---|---|
| Google Cloud Speech (nem Whisper) | CEE minőség: HU szakszókincs ≈ 50–65% pontosság (Whisper: 92–96%) |
| Csak saját felületen | Az összes natív alkalmazásból kizárva (EHR, CRM, IDE, Word) |
| Copy-paste workflow | 2-3 plusz lépés minden diktálás után — flow state megélés megszakítása |
| Nincs offline | MedTech és LegalTech vállalati környezetben diszkvalifikálja |
VibeVox vs. Speechnotes — stratégiai pozíció
3M felhasználóból a legtöbb "csak kipróbálta" és eldobta — pontosan az az átéréttelés, ami újonnan érkező usereket kialakít. A Speechnotes-től való átváltás narratívája:
Marketing angle:
„Speechnotes egy note pad. A VibeVox a billentyűzeted. Írjon bárhova — a Praetorba, az IDE-dbe, a Wordba. Nem kell copy-paste többé."
CEE language quality angle:
„A Google Speech API 2024-ben még mindig nem érti a magyart. A VibeVox Groq Whisper large-v3-mal dolgozik — 92–96%-os CEE pontossággal."
18. VibeType
Státusz: Korai fázis, lokális AI voice coding asszisztens, macOS-központú Forrás: Brandkutatás közben azonosítva (2026-04-10) Fenyegetési szint: 🟡 Közepes — fejlesztői szegmensben közvetlen versenytárs, de Apple-only és nincs CEE
Termékleírás
A VibeType egy „local-first" AI-alapú hangasszisztens fejlesztőknek — hangutasításokat fordít le kóddá és rendszerakciókká, miközben az adatokat on-device tartja az adatvédelem érdekében. A „vibe coding" trend (természetes nyelvű szoftverfejlesztés AI-val) kontextusában működik.
| Faktor | Részlet |
|---|---|
| Típus | Lokális AI voice asszisztens + kód diktálás |
| Platform | macOS (korai fázis) |
| Offline | ✅ Teljesen lokális feldolgozás |
| BYOK | ✅ Lokális modell (nincs API kulcs szükséges) |
| CEE lokalizáció | ❌ Nincs |
| Árazás | N/A (korai fázis / ingyenes beta) |
| Linux | ❌ Nincs |
VibeVox vs. VibeType
| Dimenzió | VibeType | VibeVox |
|---|---|---|
| Platform | Csak macOS | Windows + Linux (+ Android Fázis 4) |
| Célcsoport | AI-natív fejlesztők (vibe coding) | Dev + jogász + orvos + általános felhasználó |
| CEE lokalizáció | ❌ | ✅ HU/SK/PL/CS filler removal |
| Offline minőség | Lokális modell (limitált CEE) | Cloud Whisper large-v3 (92–96% CEE) |
| Árazás | Ingyenes/open | €3,50/hó BYOK — sustain. üzleti modell |
| Érettség | Korai fázis / beta | Production-kész SaaS |
VibeVox pozíció: A VibeType a dev-szegmens Apple-only, vibe coding niche-e — a VibeVox a cross-platform, CEE-lokalizált, fenntartható alternatíva ugyanannak a fejlesztői szegmensnek.
19. VibeScribe
Státusz: AI-alapú macOS voice-to-text app, korai fázisú SaaS Forrás: Brandkutatás közben azonosítva (2026-04-10) — vibescribe.me Fenyegetési szint: 🟢 Alacsony — csak macOS, nincs CEE, nincs Linux
Termékleírás
A VibeScribe egy macOS-alkalmazás, amely real-time speech-to-text transzkripciót kínál, egyedi AI finomítási stílusokkal (custom prompts). Floating caption window és privacy-fókuszú feldolgozás.
| Faktor | Részlet |
|---|---|
| Típus | AI-alapú voice-to-text, macOS |
| Platform | Mac only |
| Offline | ✅ Részben (privacy-focused processing) |
| BYOK | ❌ |
| CEE lokalizáció | ❌ |
| Linux | ❌ |
VibeVox differenciátor: VibeScribe = Apple-only, CEE-képtelen, nincs BYOK. A VibeVox = cross-platform, CEE-lokalizált, BYOK-first.
20. Dictly
Státusz: Natív macOS + iOS offline dictation app — 2025 végén jelent meg Forrás: Brandkutatás közben azonosítva (2026-04-10) Fenyegetési szint: 🟢 Alacsony — Apple-only, nincs Linux/Windows, nincs CEE
Termékleírás
A Dictly 2025 végén megjelent natív macOS és iOS alkalmazás — private, local, offline voice-to-text diktálásra. Real-time transzkripció, custom dictionary profilok (szakszókincs), és teljes on-device feldolgozás jellemzi.
| Faktor | Részlet |
|---|---|
| Típus | Natív offline dictation |
| Platform | macOS + iOS |
| Offline | ✅ 100% on-device |
| BYOK | N/A (lokális modell) |
| CEE lokalizáció | ❌ |
| Linux | ❌ |
| Árazás | N/A (korai fázis) |
VibeVox differenciátor: Dictly = Apple-only, lokális minőség (gyengébb CEE). VibeVox = cloud Whisper large-v3 minőség, cross-platform, CEE filler removal.
21. VoxTap
Státusz: Lightweight macOS offline dictation tool Forrás: Brandkutatás közben azonosítva (2026-04-10) Fenyegetési szint: 🟢 Alacsony — Apple-only, minimális funkciókészlet
Termékleírás
A VoxTap macOS és iOS-alkalmazás: lightweight, offline diktáló tool egyéni hotkey-vel, az aktív szövegmezőbe ír. A VibeVox-hez hasonló „hold-to-talk" paradigmát követ, de csak Apple platformon.
| Faktor | Részlet |
|---|---|
| Típus | Offline dictation, hold-to-talk gesztus |
| Platform | macOS |
| Offline | ✅ On-device |
| BYOK | N/A |
| CEE lokalizáció | ❌ |
| Linux | ❌ |
VibeVox pozíció: A VoxTap ugyanazt az UX-paradigmát követi (hold-to-talk, lightweight), de Apple-only és CEE-képtelen. A VibeVox a Windows/Linux cross-platform alternatíva ugyanennek a user típusnak — aki a privacy-t és a minimalizmust értékeli.
Árazás-összahasonlítás
| Versenytárs | Havi ár | Éves ár | LTD | VibeVox vs. |
|---|---|---|---|---|
| Wispr Flow | $12–15 | $144 | ❌ | VibeVox Pro: €9,99/hó = olcsóbb |
| Typeless | $30 havi / $12 éves | $144 | ❌ | VibeVox Pro: €79/év = 45% olcsóbb |
| Superwhisper | $8,49 | $84,99 | $249,99 | VibeVox LTD: €79 = 68% olcsóbb |
| MacWhisper | — | — | €269 | VibeVox LTD: €79 = 70% olcsóbb |
| AquaVoice | — | $96 | ❌ | VibeVox Pro éves: €79 = olcsóbb |
| Spokenly | $9,99 | — | ❌ | VibeVox BYOK: €3,50/hó = 65% olcsóbb |
| Otter.ai | $8–30 | $96–360 | ❌ | VibeVox Pro: €79/év = 18–78% olcsóbb |
| VibeVox Pro | €9,99 | €79/év | ❌ Nincs | Pro = havi vagy éves; LTD nincs |
| VibeVox BYOK | €3,50 | — | €79 LTD | Kizárólag BYOK tierhez — Versenytárs-tördő ár |
Piaci skála összehasonlítás
| Versenytárs | ARR (becsült) | Felhasználók | Finanszíroz. |
|---|---|---|---|
| Otter.ai | $100M+ | 35M+ | VC |
| Wispr Flow | $25M–$50M | 1M+ | VC ($81M) |
| Transkriptor | $15M–$30M | 1M+ | Bootstrapped |
| Superwhisper | $2M–$5M | Több százezer | Bootstrapped |
| MacWhisper | $1,5M–$3M+ | 385K+ értékesítés | Bootstrapped |
| Beey.ai | N/A | 50K+ CEE | Newton Tech. |
| VibeVox (cél) | — | CEE first | Bootstrapped |
Privacy és biztonság összehasonlítás
| Versenytárs | Screenshot | Clipboard | Billentyűzet | Audio | Szerver lokáció |
|---|---|---|---|---|---|
| Wispr Flow | 🔴 Folyamatos | ❓ | ❓ | 🔴 US/Meta cloud | US |
| Typeless | ❌ | 🔴 Scraping | 🔴 CGEventTap | 🟡 Zero retention | US |
| Superwhisper | ❌ | ❌ | ❌ | ✅ Lokális | Nincs szerver |
| MacWhisper | ❌ | ❌ | ❌ | ✅ Lokális | Nincs szerver |
| Spokenly | ❌ | ❌ | ❌ | ✅ Lokális/BYOK | Nincs/BYOK |
| AquaVoice | ❌ | ❌ | ❌ | 🟡 Cloud | US (?) |
| Otter.ai | ❌ | ❌ | ❌ | 🔴 US AWS | US |
| VibeVox | ❌ | ❌ | ❌ | ✅ EU Frankfurt | EU Frankfurt |
Platform-lefedettség
| Versenytárs | Windows | macOS | Linux | Android | iOS | Web | CWS Extension |
|---|---|---|---|---|---|---|---|
| Wispr Flow | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ |
| Typeless | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ | ❌ |
| Superwhisper | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ❌ |
| MacWhisper | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ❌ |
| Spokenly | ❌ | ✅ | ❌ | ❌ | ✅ | ❌ | ❌ |
| Beey.ai | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ |
| AquaVoice | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| Voxtype | ❌ | ❌ | ✅ | ❌ | ❌ | ❌ | ❌ |
| OpenWhispr | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| Otter.ai | ❌ | ❌ | ❌ | ✅ | ✅ | ✅ | ❌ |
| VoiceIn | ❌ | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ (böngésző-only) |
| Speechnotes | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ | ✅ (böngésző-only) |
| VibeVox | ✅ | Fázis 5 | ✅ | Fázis 4 | Fázis 5 | ❌ | ✅ (Fázis 2b, Native Messaging) |
BYOK támogatás összehasonlítás
| Versenytárs | BYOK? | Feltétel | VibeVox előny |
|---|---|---|---|
| Wispr Flow | ❌ Tiltott | — | ✅ VibeVox: BYOK €3,50/hó |
| Typeless | ❌ Tiltott | — | ✅ VibeVox: BYOK €3,50/hó |
| Superwhisper | 🟡 Pro-hoz kötött | $8,49/hó kell a BYOK-hoz is | ✅ VibeVox: BYOK önálló terv |
| MacWhisper | ✅ Szabad | Díjmentes | 🟡 MacWhisper: csak Apple |
| Spokenly | ✅ Free tierben | Ingyenes, korlátlan | 🟡 Spokenly: csak Apple |
| AquaVoice | ❌ Tiltott | — | ✅ VibeVox: BYOK €3,50/hó |
| OpenWhispr | ✅ Free tierben | Korlátlan, ingyenes | 🟡 OpenWhispr: nincs CEE lok. |
| VibeVox | ✅ Önálló BYOK Plan | €3,50/hó — LTD: €79 | — |
Churn-analízis
A NotebookLM kutatás (2026-04-04) az AI STT appok piacán 30–58% éves churn rátát mér. Havi szinten ez 3–7% havidíj-lemorzsolódást jelent. Az éves retenció az iparágban csupán 21,1% — ez 2026-os adat, és az iparági „retention crisis" jele.
Fő churn-okok és az érintett versenytársak
| Churn ok | Érintett versenytárs | VibeVox válasz |
|---|---|---|
| Privacy-botrány (screenshot, clipboard) | Wispr Flow, Typeless | Hold-to-talk, zero scraping, EU Frankfurt szerver |
| Electron / RAM bloat | Wispr Flow (~800 MB) | Natív PySide6, <100 MB RAM |
| Subscription fatigue | Wispr ($15), Typeless ($12) | BYOK €3,50/hó, LTD €79 — „ne béreld a produktivitásodat" |
| Szemantikai inverzió (auto-format hibák) | Wispr Flow | Opcionális filler removal — a user dönt, nem az AI |
| AI Ghostwriter szindróma (mondatátírás, stílusmódosítás) | Wispr Flow, Typeless | Literal Mode default — VibeVox soha nem „javít" stilisztikailag |
| Hallucinations (csend → random szöveg) | Wispr Flow, AquaVoice | Hold-to-talk = nincs csend-feldolgozás; kliens VAD réteg (Fázis 1) |
| Cloud latency (1,5–3 sec) | Wispr Flow, AquaVoice | Groq Whisper: ~1 sec pipeline |
| Geográfiai profilozás (IP-alapú szleng-injekció) | Typeless | VibeVox: explicit user-beállított Primary Language, nincs IP-alapú módosítás |
| 6 perces session limit | Typeless | VibeVox is 6 perc — de mint „quality assurance", nem limitáció |
| CEE nyelvi minőség | Gboard, offline modellek | Groq Whisper large-v3 holisztikus feldolgozás |
| Nincs Linux | Wispr, Typeless, AquaVoice | VibeVox: AppImage, Flatpak, .deb, .rpm, AUR |
| Hardware korlát (offline modellek) | Superwhisper, MacWhisper 8 GB RAM-on | VibeVox: cloud-alapú, nincs hardware taxon |
Erőforrás-fogyasztás Benchmark (kutatás alapján, 2026-04)
Forrás: Churn post-mortem felmérés és user community reports. Ezek a számok landing page-en, sales PDF-ben és PH gallery-ben közvetlen marketing anyagként használhatók.
| App | RAM (idle) | CPU (idle) | Architektúra | Battery hatás | VibeVox előny |
|---|---|---|---|---|---|
| Wispr Flow | ~800 MB | 8–13% | Electron wrapper | „Jet Engine" fan noise | 8× kevesebb RAM |
| MacWhisper | 1.6 GB+ | Változó | Lokális Whisper model | Severe battery drain | Cloud = nincs lokális modell |
| Superwhisper | 1.2 GB+ | Változó | Lokális Whisper model | Severe battery drain | Cloud = nincs lokális modell |
| AquaVoice | ~200 MB | Alacsony | Cloud-only | Alacsony | Offline fallback opció |
| VibeVox | <100 MB | <2% | Natív PySide6 | Minimális | — |
Landing page copy: „A VibeVox 8× kevesebb memóriát használ, mint a Wispr Flow. Nem harcol az IDE-vel — csendben vár, amíg szükséged van rá."
VibeVox stratégiai pozícionálás
A 4 fő marketing hook
Hook 1: „Anti-Surveillance Garancia"
„Mikrofon. Nem surveillance eszköz. Zero screen-scraping, zero clipboard reading. 100% EU Frankfurt szerveren."
Bonus B2B hook: VDI/Citrix-kompatibilis — nem routol hangot a remote session-ön keresztül, nincs karakter-kiesés.
Célzott versenytárs exodus: Wispr Flow screenshot-botrány + Typeless clipboard scraping B2B célcsoport: Klinikai IT MSP-k és VDI-t üzemeltető jogi irodák
Hook 2: „Az Electron Bloat Vége"
„Natív OS integráció, <100MB RAM. Nem harcol az IDE-vel memóriáért. Nincs Electron."
Célzott versenytárs exodus: Wispr Flow 800 MB RAM + MacWhisper 1,6 GB modell
Hook 3: „Az Előfizetés Halott"
„BYOK 3,50 EUR/hó. LTD 79 EUR. Ne béreld a produktivitásodat."
Célzott versenytárs exodus: Wispr $15/hó + Typeless $12/hó + Superwhisper LTD $249,99
Hook 4: „Diktálás Citrix-ben, végre latency nélkül" (B2B-specifikus)
„A VibeVox a helyi OS-en fut — a VDI session csak egy ablak. Nincs audio routing, nincs character drop."
„Ha lehet benne gépelni, lehet benne diktálni — Praetorban, mMedicá-ban, netDoktorban, mindenütt."
Célzott B2B szegmens: Klinikák és jogi irodák Citrix/VDI környezetben Miért egyedi: Egyetlen cloud diktáló sem oldja meg a VDI latency problémát — a VibeVox OS-level architektúrája natívan megkerüli.
Versenytárs Exodus Messaging — „Fatal Flaw Profiles"
Forrás: Churn post-mortem kutatás (2026-04). Minden vezető versenytársnak van egy azonosítható „fatal flaw"-ja, amely felhasználók aktív elvándorlását okozza. A VibeVox marketing ezeket a specifikus fájdalmakat célozza.
| Versenytárs | „Fatal Flaw" Profil | VibeVox Exodus Messaging |
|---|---|---|
| Wispr Flow | „A Surveillance Resource Hog" | „800MB RAM + screenshot scraping? Próbáld a VibeVox-t: <100MB, zero surveillance." |
| Typeless | „A Geográfiailag Zavarodott Sandbox" | „6 perces limit + IP-alapú szleng? A VibeVox nem profiloz és nem limitál." |
| AquaVoice | „A Felhőhöz Láncolt Írnok" | „Repülőn nem működik? A VibeVox hold-to-talk — offline feldolgozás is opció." |
| Superwhisper/MacWhisper | „Az Aranyozott Nehéz Ketrec" | „$249 LTD + csak Apple + 1,6GB RAM? VibeVox BYOK €79 LTD, Windows + Linux." |
Használat: Landing page comparison section · PH First Comment · Reddit exodus válaszok · Affiliate briefing
VibeVox egyedi pozíció — amit senki más nem kínál
| Kombináció | Miért egyedi |
|---|---|
| EU Frankfurt szerver + BYOK + natív app + Linux támogatás | ✅ Egyetlen ilyen versenytárs sem létezik |
| CEE lokalizált UI (HU/SK/PL/CS) + cloud Whisper large-v3 | ✅ Beey.io-nak nincs real-time injection; Transkriptor-nak nincs diktálás |
| €3,50/hó BYOK Plan + €79 LTD | ✅ 68–70%-kal olcsóbb LTD mint Superwhisper/MacWhisper |
| <100 MB RAM + globális hotkey + valós idejű diktálás | ✅ Csak offline tools teljesítik a RAM-limit, de nincs cloud minőség |
| Hold-to-talk + filler word removal (CEE-specifikus) | ✅ „ööö", „hát", „szóval" — CEE-specifikus, egyedi |
| Windows + Linux + Android (tervezett) egyetlen kódbázisból | ✅ Nincs más versenytárs mind a három platformon |
| OS-level injection — VDI/Citrix kompatibilis (nincs audio routing) | ✅ Egyetlen cloud diktáló sem oldja meg a VDI latency problémát natívan |
| Praetor, mMedica, EESZT web — bármely alkalmazásba injektál | ✅ Zero API integráció szükséges — ha lehet gépelni benne, lehet diktálni |
MedAssist (Precognox) — Magyar orvosi versenytárs (HU)
Státusz: Helyi, specializált AI transzkripciós eszköz — közvetlen konkurens a HU orvosi szegmensben Fejlesztő: Precognox Kft. (hazai kutatás-fejlesztési grants) Fenyegetési szint: 🟡 Közepes — orvosi niche-ben releváns, de zárt ökoszisztéma
Termékleírás
A MedAssist egy NLP-alapú orvosi transzkripciós eszköz, amely strukturált ambuláns lapokat generál rögzített orvos-beteg hanganyagból. A Precognox Kft. fejlesztette hazai kutatási finanszírozással.
| Faktor | Részlet |
|---|---|
| Működési mód | Felvétel → NLP feldolgozás → strukturált orvosi dokumentum |
| Integráció | Dedikált orvosi dokumentáció platform — zárt ökoszisztéma |
| Célcsoport | Magyar általános orvosok, ambuláns rendelők |
| Árazás | N/A (kutatási finanszírozás; kereskedelmi ár ismeretlen) |
| Platform | Nem OS-level — dedikált kliens |
VibeVox vs. MedAssist
| Dimenzió | MedAssist (Precognox) | VibeVox |
|---|---|---|
| Működési mód | Aszinkron felvétel → post-processing | Real-time OS-level injekció |
| EHR kompatibilitás | Saját platformon belül | Bármely EHR-be (netDoktor, Cloudent, EESZT web) |
| Rugalmasság | Zárt ökoszisztéma | Bármely alkalmazásba diktál |
| Hozzáférhetőség | Kutatási pilot — nem széles körben elérhető | Production-kész SaaS |
| Ár | Ismeretlen / grant-alapú | €3,50/hó BYOK vagy Pro terv |
| EU compliance | 🟡 Részben ismert | ✅ Frankfurt szerver + DPA dokumentált |
VibeVox válasz: A MedAssist egy specializált, zárt eszköz — VibeVox az universális, nyílt alternatíva. Ha az orvos a MedAssist-en kívül bármit diktálni akar (email, lelet, recept), VibeVox az egyetlen megoldás. A pitch: „Nem váltod le a MedAssist-et — hanem kiegészíted azzal, ami kimaradt."
ZnanyLekarz „Noa Notes" — Monitoring (PL orvosi szektor)
Feltörekvő in-platform fenyegetés: A ZnanyLekarz (Docplanner) — amely 20,000+ lengyel klinikát szolgál ki — bevezette a „Noa Notes" AI funkcióját, amely automatikus orvosi dokumentálást kínál. Jelenleg csak a ZnanyLekarz EDM modulján belül működik, nem OS-level eszköz. A VibeVox bármilyen alkalmazásba injektál — ez az előnye. De ha a Docplanner kiterjeszti az AI diktálást platformszinten, az a PL orvosi szegmenst veszélyezteti.
| Faktor | Részlet |
|---|---|
| Platform | Web SaaS (ZnanyLekarz.pl) |
| AI funkció | „Noa Notes" — automatikus orvosi diktálás a saját EDM modulban |
| Felhasználók | 20,000+ klinika (Docplanner hálózat) |
| Jelenlegi fenyegetés | 🟡 Közepes — zárt platform, nem universal tool |
| VibeVox differenciátor | VibeVox bármely alkalmazásba injektál; Noa Notes csak ZnanyLekarz-on belül |
Monitoring: Negyedévente ellenőrizni a Docplanner feature changelog-ot és blog-ot.
SpeakLeash/Bielik — CEE-natív Open-Source STT (PL · Monitoring)
Fenyegetési szint: 🟡 Közepes — 2027+ horizont · Jelenleg: korai monitoring Forrás: Strategic Architecture and Market Analysis (2026-04-11)
A SpeakLeash egy lengyel open-source AI konzorcium, amelynek fő terméke a Bielik alapnyelvi modell. A projekt 2024-ben több millió token lengyel korpuszon tanított modellt publikált, és aktívan bővül CEE NLP területen.
| Faktor | Részlet |
|---|---|
| Szervezet | SpeakLeash initiative — lengyel akadémiai és ipari konzorcium |
| Termék | Bielik LLM (PL natív, open-source) — primárisan NLP/LLM, STT komponens roadmapban |
| Jelenlegi STT státusz | ❌ Nincs production STT release (2026 Q2) — korai kutatási fázis |
| CEE morfológiai előny | ✅ PL natív — agglutináló morfológia és diakritikus karakterek natív kezelése |
| Ár / licenc | Open-source (Apache 2.0 / MIT várható) — ingyenes deployment |
| Fenyegetési horizon | 2027–2028: ha community fine-tuning STT modult hoz létre és a WER eléri a Whisper large-v3-turbo szintet |
Mi változtatna ezen?
- Ha a SpeakLeash STT WER ≤ 6% PL-en (Whisper szint) → BYOK provider opcióként integrálható a VibeVox-be
- Ha community deployment megjelenik → a VibeVox BYOK ökoszisztémájába becsatornázható (nem fenyegetés, hanem opportunity)
- Ha standalone PL diktáló app jelenik meg a SpeakLeash modellre alapozva → közvetlen fenyegetés a PL szegmensben
Monitoring feladat: Negyedévente ellenőrizni a SpeakLeash GitHub changelog-ját, Bielik release note-okat, és a lengyel AI közösségi fórumokat (PyTorch PL, AI Devs PL).
Gboard CEE hibák — Android Launch Marketing (Fázis 4)
A VibeVox Android launch (Fázis 4) legerősebb marketing fegyvere — a Gboard az Android egyetlen beépített alternatívája, és a hibái dokumentálhatóak és reprodukálhatóak CEE nyelveken.
| Hiba | Leírás | VibeVox megoldás |
|---|---|---|
| „Word Salad" | Offline+cloud hybrid → szöveg önátíródik, töröl mondatrészeket | Tisztán cloud → Whisper v3 egészben dolgozza fel a hangot |
| Normalization Bug | PL: „Spotkajmy się w Warszawa kropka" → „w warszawa." (kisbetű!) | Backend-oldali írásjel mapping a post_process előtt |
| Jargon Gap | Personal Dictionary ignorálva voice mode-ban (IT/jogi/orvosi szavak autocorrect-elődnek) | BYOK prompt context + vocabulary.db injekció |
Android launch marketing hook (Fázis 4 landing page):
„A Gboard nem érti a magyar/lengyel/cseh nyelvet. Nem azért, mert nem tudja — hanem mert a saját offline modellje harcol a felhő modellel. A VibeVox nem kompromisszumol: egy modell, egy feldolgozás, tökéletes eredmény."
„Gboard vs VibeVox" összehasonlítás (konverziós blokk):
| Gboard | VibeVox | |
|---|---|---|
| CEE morfológia | ❌ Normalization bug | ✅ Whisper v3 natív |
| Saját szótár (voice) | ❌ Ignorálva | ✅ Prompt injection |
| Szöveg önátírás | ❌ Word salad | ✅ Single-pass cloud |
| Adattárolás | ❌ Google servers | ✅ EU Frankfurt |
| Linux platform | ❌ Nincs | ✅ Natív |
Cross-Device Sync Versenytársak (Android wireless mic kontextus)
A VibeVox Fázis 4 „wireless mic mód" funkciója közvetlenül versenyez ezekkel az eszközökkel a cross-device workflow piacon — különösen a Linux power user szegmensben (~1,58M CEE felhasználó).
| Eszköz | LAN/WAN | Linux | Android 12+ clipboard | VibeVox előny |
|---|---|---|---|---|
| KDE Connect | Csak LAN | ✅ | ❌ Manuális „Send Clipboard" gomb | WAN-on is működik, FCM, automatikus |
| Phone Link | WAN | ❌ | ⚠️ Microsoft telemetria | Natív Linux + Windows |
| Syncthing | LAN/WAN | ✅ | ❌ Nincs clipboard mgmt | Szöveg-specifikus, nem fájl |
| Pushbullet | WAN | ⚠️ | ⚠️ Elhanyagolt fejlesztés | Aktívan fejlesztett, privacy-first |
KDE Connect korlát — miért fontos:
- Android 10+ elvette a háttér-clipboard olvasási jogot → KDE Connect „Send Clipboard" gombja manuális felhasználói akciót igényel
- Cellular/5G hálózaton → nem működik (LAN-only architektúra)
- Linux power userek ismerik és szeretik a KDE Connect-et, de tudják a korlátait
Marketing pozícionálás (Fázis 4 launch):
„A VibeVox wireless mic mód = amit a KDE Connect clipboard akart lenni, de az Android 10+ megölte. Mi nem clipboard-ot küldünk — szöveget. WAN-on is. Cellular-on is. Automatikusan."
CEE AI STT Startupok — 12-18 hónap figyelési lista
Forrás: Competitive Intelligence Report (2026-04-08) — VibeVox vs. Beey.ai Frissítve: 2026-04-08 | Prioritás: Backlog / P2 (doc monitoring, nincs fejlesztési cost)
Ezek a CEE-specifikus AI startupok jelenleg nem közvetlen versenytársak, de technikai kapacitásuk és lokalizált pozíciójuk alapján 12-18 hónap múlva valós fenyegetéssé válhatnak.
VoiceLab.ai (Lengyelország)
| Dimenzió | Adat |
|---|---|
| Profil | B2B Conversational Intelligence, TRURL LLM (PL), Wordlify mobil app |
| Jelenlegi termék | Wordlify: automatikus találkozó-transzkripció — mobil/web fókusz |
| Veszély a VibeVox-re | Közepes — 12-18 hónap |
| Miért nem most? | Wordlify mobil/web — nincs OS-szintű diktálás, nincs Linux |
| Monitor | Wordlify roadmap, GitHub aktivitás, lengyel lokalizáció depth |
| Differenciátor VibeVox-től | VibeVox: Linux-native + BYOK + OS-injection; VoiceLab: B2B enterprise fókusz, mobil |
„VoiceLab currently operates an application called 'Wordlify,' which automatically transcribes conversations and meetings primarily via mobile devices. VoiceLab's deep, localized expertise in real-time Polish speech recognition and their robust existing API infrastructure indicate they are technically highly capable of building a direct VibeVox clone if they perceive sufficient market demand."
Watch signals: Ha Wordlify desktop appot jelent be / Ha VoiceLab OS-szintű injectiont fejleszt / Ha PL B2C diktálásba lép.
Vatis Tech (Románia / Magyarország)
| Dimenzió | Adat |
|---|---|
| Profil | API-first STT infrastruktúra, <700ms latencia, 95% domain accuracy |
| Jelenlegi termék | Enterprise backend API — telco, bank, call center |
| Veszély a VibeVox-re | Alacsony-közepes: infrastructure vendor, nem consumer app |
| Lehetőség | Potenciális partner: HU/SK dialektusokban Groq alternatíva |
| Monitor | Ha consumer dictation client-et indít (B2C pivot) |
„They boast exceptional backend API infrastructure capable of supporting real-time streaming via WebSockets, claiming latencies of less than 700 milliseconds [...] However, Vatis Tech operates primarily as an infrastructure provider (an API vendor) rather than building a B2C application layer."
Watch signals: Ha Vatis Tech saját desktop/web klienst indít / Ha HU/SK B2C piacra lép / Ha VibeVox BYOK providerként integrálható-e.
Techmo (Lengyelország)
| Dimenzió | Adat |
|---|---|
| Profil | AGH University spin-off, enterprise-only STT (telco, bank, call center) |
| Jelenlegi termék | B2B enterprise platform — nem B2C retail |
| Veszély a VibeVox-re | Alacsony — B2C retail piacra belépés nem valószínű |
| Monitor | Ha consumer dictation-ba lép |
KInIT / Nettle.ai (Szlovákia)
| Dimenzió | Adat |
|---|---|
| Profil | SlovakBERT kutatás (KInIT) / enterprise voicebot (Nettle.ai) |
| Jelenlegi termék | Open research + B2B voicebot — nem OS-szintű diktálás |
| Veszély a VibeVox-re | Alacsony — open research, nem közvetlen competitor |
| Lehetőség | SlovakBERT downstream modellek javíthatják VibeVox SK feldolgozást — partner lehetőség |
| Monitor | SlovakBERT fine-tuned STT model megjelenése |
Monitoring checklist (negyedévente)
- VoiceLab Wordlify desktop app bejelentés?
- Vatis Tech consumer pivot?
- Új CEE-specifikus OS-level diktáló startup?
- Newton Technologies / Beey.ai real-time feature bejelentés?
Dokumentum státusz: Frissítve 2026-04-10 (4 új versenytárs hozzáadva brandkutatás alapján: VibeType #18, VibeScribe #19, Dictly #20, VoxTap #21 — mind Apple-only, alacsony fenyegetés. + 2026-04-08: CEE AI STT Startupok figyelési lista + 2026-04-07: CEE B2B/SMB + Android Blueprint). Frissítendő, ha:
- A Beey.io real-time diktálást fejleszt (KRITIKUS!)
- A Wispr Flow BYOK-ot vezet be (csökkentené a VibeVox BYOK előnyét)
- A Spokenly Windows/Linux-ra terjeszkedik
- A ZnanyLekarz Noa Notes OS-level diktálást vezet be (PL orvosi fenyegetés)
- VoiceLab.ai Wordlify desktop appot jelez be
- Vatis Tech B2C pivot jel
- VibeType Linux/Windows-ra terjeszkedik (dev szegmens kockázat!)
- Új CEE-specifikus versenytárs lép piacra
Linux ETK — Existing Tool Landscape Mátrix ✅ [Win10 EoL GTM — GAP-7 beépítve]
A riport Linux ETK ajánlása (GAP-7): A Win10 migráns fejlesztők és power userek már meglévő, de fragmentált és korlátozott Linux voice toolokat használnak. Ez a mátrix dokumentálja a tényleges Linux-on létező eszközöket és azt, hogy a VibeVox miért nyeri meg ezt a versenyt.
Általánosan elérhető Linux voice toolok
| Eszköz | Típus | Elérhetőség Linuxon | Korlátok | VibeVox előny |
|---|---|---|---|---|
| GNOME Speech Recognition | Built-in (GNOME 44+) | ✅ Natív | Csak GNOME, nincs globális hotkey, nincs custom vocab | Cross-DE, hold-to-talk, custom vocab |
| KDE Dictation | Built-in (KDE Plasma 6) | ✅ Natív | Csak KDE, offline Vosk motor (gyengébb minőség) | Whisper minőség, BYOK, cross-DE |
| Speechnotes (web) | Browser-based | ✅ Browser-ben | Nincs system-wide injection, nem natív | OS-szintű szöveg beillesztés |
| VoiceIn (Chrome ext.) | Browser extension | ✅ Chrome-ban | MV3 korlátok, csak böngészőben | Bármely alkalmazásban működik |
| nerd-dictation | CLI + Vosk | ✅ GitHub | Parancssori beállítás, nincs GUI, Vosk minőség | GUI, Whisper, CEE языki, BYOK |
| Whisper CLI (直接) | CLI | ✅ pip install | Nincs real-time, fájl-alapú, nincs integration | Real-time, hold-to-talk, injection |
| whisper.cpp | CLI | ✅ compiled | Nincs GUI, nincs integration | GUI + workflow integration |
| Google Chrome Voice Input | Browser | ✅ Browser-ben | Csak web, nincs natív app integration | System-wide, offline-capable BYOK |
| Orca | Screen reader STT | ✅ Accessibility | Accessibility fókusz, nem diktáló tool | Diktálás fókusz, nem SR |
Win10 migráns specifikus fenyegetések és válaszok
| Migráns szokása Win10-en | Linux megfelelő (elégtelen) | VibeVox megoldás |
|---|---|---|
| Windows Voice Access (Win+H) | GNOME Speech (DE-only, korlátolt) | Hold-to-talk, system-wide, minden DE |
| Dragon NaturallySpeaking | Nincs Linux natív Dragon | BYOK + Domain Mode → hasonló minőség |
| Word diktálás (beépített) | LibreOffice Writer STT (gyenge) | System-wide injection Works minden appban |
| Edge Immersive Reader | Nincs Linux megfelelője | VibeVox + Text-to-Speech: olvasás + diktálás |
| Cortana diktálás | — (teljesen eltűnt) | VibeVox az egyetlen Cortana replacement Linuxon |
Összefoglaló — miért nyeri a VibeVox a Linux ETK versenyt
Linux ETK versenypozíció összefoglalás:
NINCS egyetlen kereskedelmi, cross-DE, hold-to-talk,
Whisper-minőségű, CEE-lokalizált diktáló app Linuxon.
A fragmentált open-source toolok (nerd-dictation, whisper.cpp)
technikai felhasználókat céloznak — a Win10 migráns
non-fejlesztő professionális (VA, ügyvéd, orvos) számára
ezek nem opciók.
VibeVox = az egyetlen produkt-szintű megoldás erre a szegmensre.
Frissítési trigger: Ha a GNOME/KDE beépített diktálás Whisper backendre vált és cross-DE-vé válik, ez az ETK mátrix elavul. Figyeljük: GNOME Speech plugin roadmap + KDE Plasma 6.x changelog negyedévente.
Zero-Knowledge Sync Versenyelőny ✅ [2026-04-17 hozzáadva]
Ez a szekció dokumentálja azt a privacy differentiatort, amit egyetlen versenytárs sem kínál 2026-ban.
Miért nem implementál E2E titkosítást a Wispr Flow vagy a Typeless?
Az E2E titkosítás technikai összetettsége nem negligálható — de egy $81M VC-finanszírozott startup számára (Wispr Flow) bőven lefejleszthető lenne. Mégsem teszik. Az ok strukturális:
| Ok | Magyarázat |
|---|---|
| Surveillance-modell kizárja | Wispr Flow az AI kontextualizálást screen/DOM scraping alapján csinálja — E2E titkosítás ezt technikailag lehetetlenné tenné |
| Analytics dependency | Mindkét cég user behavioron alapuló AI tanítást végez — ha az adat titkosított, ez lehetetlen |
| A VC elvárja a data monetizálást | A befektetők long-term értéket látnak a user data aggregációban → zero-knowledge ellentétes az üzleti modellel |
Versenytárs sync privacy összehasonlítás
| Szolgáltató | Cloud sync | E2E titkosítás | Local-Only mód | Zero-Knowledge |
|---|---|---|---|---|
| Wispr Flow | ✅ (kötelező) | ❌ | ❌ | ❌ |
| Typeless | ✅ (kötelező) | ❌ | ❌ | ❌ |
| Superwhisper | ✅ iCloud | ❌ (Apple szintű) | ➖ korlátolt | ❌ |
| MacWhisper | ❌ nincs sync | — | ✅ (offline only) | — |
| VibeVox | ✅ opcionális | ✅ AES-256-GCM | ✅ Local-Only toggle | ✅ jelszó soha nem megy szerverre |
Miért hinni a VibeVox-nek?
A zero-knowledge garancia nem önbevallás jellegű — technikai architektúra-szintű bizonyíték:
- Password reset LEHETETLEN — ha a jelszót mi is tárolnánk, visszaállíthatnánk. Ha nem tudjuk visszaállítani, ez matematikailag bizonyítja, hogy soha nem volt hozzáférésünk
- Nyílt forráskódú
encryption.py— a titkosítási modul auditálható - Supabase-ben csak titkosított blob — ha a Supabase-t feltörik, az adatok olvashatatlanok
Marketing üzenet: „Ha elveszíti a jelszavát — mi sem tudjuk visszaállítani. Ez nem bug. Ez a garancia." Ez az egyetlen állítás, amit egyetlen versenytárs sem tud lemásolni anélkül, hogy az egész üzleti modelljét újraírná.