Fordítóiroda

Attól függ, milyen nyelvről beszélünk és az sem mellékes, mennyire megyünk bele a részletekbe. Nyelv- és szóhossz-táblázat.

A szavak minden nyelvben eltérő hosszúságúak. A sztereotípiák szerint az angol szavak inkább a rövidek (pl. I am at a zoo.), míg a németek hosszúak (erre élvezettel kereshetünk példákat a Google-ban). A Stanford Egyetem kutatói szerint a szavak hossza arányos a fogalmi komplexitásukkal, amely állítást az MIT tudósai azzal az egyszerűsített tézissel erősítettek meg, miszerint a szavak hossza tükrözi a jelentésük információtartalmát.

Ezek a 21. századi elméletek nem cáfolják meg, hogy azt az évtizedeken keresztül hangoztatott nyelvészeti tanítást sem, hogy a nyelvek a hatékonyságuk irányába fejlődnek, tehát ha röviden is el lehet ugyan azt mondani, mint hosszan, akkor a tömörebb megfogalmazás (vagy szinonima) válik gyakoribbá.

A szavak hosszát értelemszerűen a betűk számával mérik. Mégis, ha szószám-betűszám átváltásra készülünk, akkor gondolnunk kell arra, hogy vajon a szóhoz hozzá tartozik-e a mellette álló szóköz. Ha egy szövegben a szószámot elosztjuk a karakterszámmal, akkor már az egy szóközzel növelt betűszámot kapjuk eredményül.

A nyelvi szolgáltató ipar (hazai fordítóirodák, szövegírók stb.) például többnyire a bruttó karakterszámot, azaz a szóközökkel együtt számolt betűszámot (az írógépes időkből származó leütésszámot) tekinti az elszámolási mértékegységének (ld. az alábbi grafikont).

Ha az egyes nyelvek átlagos szóhosszát keressük, akkor nagy mennyiségű, reprezentatív módon változatos szöveget kell elemeznünk és ebből egy egyszerű osztással nyerjük ki a szóközzel növelt átlagos betűszámot. A magyar a maga 6,5 átlagos szavankénti (szóközzel növelt) karakterszámával a gyakoribb nyelvek közé tartozik.

Zárásként álljon itt néhány valós adat a leggyakrabban előforduló nyelvek közül:

Nyelv Átlagos br. karakterszám
albán 6.4
angol 6.1
arab 6
baszk 6.5
cseh 6
dán 5.5
észt 7.3
finn 7.6
francia 5.4
görög 6.5
holland 6.5
horvát 5.6
izlandi 6
lengyel 7.2
lett 7.1
litván 6.9
magyar 6.5
német 6
norvég 5.4
olasz 6
orosz 6.1
portugál 5.7
román 6.5
spanyol 5.7
svéd 6
szlovák 6.4
török 7.2
ukrán 7.5
vietnami 4.5