Как известно, GT переводит с одного языка на другой не напрямую, а сначала переводит на английский с одного языка, а потом с английского на другой язык. Данный метод хорош тем, что словари занимают меньше места на сервере, ведь кол-во словарей вида "язык1-английский" и "английский-язык1" было бы меньше, чем кол-во словарей вида "язык1-язык2", и сейчас я это докажу.
Кол-во словарей вида "язык1-язык2" найдём по кол-ву размещений по 2 элемента (по 2 языка). Всего в GT 71 язык, тогда
![$m_1=A^{2}_{n}=A^{2}_{71}=4970$ $m_1=A^{2}_{n}=A^{2}_{71}=4970$](https://dxdy-03.korotkov.co.uk/f/2/3/3/233fe66244b7e379167de28541bb6a0082.png)
, где
![$m_1$ $m_1$](https://dxdy-01.korotkov.co.uk/f/0/4/2/0429e3dd940669f4c728ca27fe91530182.png)
- кол-во словарей вида "язык1-язык2",
![$n$ $n$](https://dxdy-02.korotkov.co.uk/f/5/5/a/55a049b8f161ae7cfeb0197d75aff96782.png)
- кол-во языков в GT.
Кол-во словарей вида "язык1-английский" и "английский-язык1" вместе взятых найдём по формуле
![$m_2=2(n-1)=2\cdot 70=140$ $m_2=2(n-1)=2\cdot 70=140$](https://dxdy-02.korotkov.co.uk/f/d/0/7/d07a38ee08f65a33f8e2e3b710ebf14082.png)
(английский язык мы не учитываем в качестве второго в паре с английским языком), где
![$m_2$ $m_2$](https://dxdy-02.korotkov.co.uk/f/d/9/a/d9ad343d20544ab9321998ec5d49eba382.png)
- кол-во словарей вида "язык1-английский" и "английский-язык1" вместе взятых.
Размер одного словаря (в байтах) будет равен
![$V_{wl}=2(n_{w}n_{l}+n_{w}n_{l}n_{s})=2n_{w}n_{l}(1+n_{s})=2\cdot 40000 \cdot 20 \cdot (1+15)=25$ $V_{wl}=2(n_{w}n_{l}+n_{w}n_{l}n_{s})=2n_{w}n_{l}(1+n_{s})=2\cdot 40000 \cdot 20 \cdot (1+15)=25$](https://dxdy-02.korotkov.co.uk/f/5/c/6/5c61e09d5749284895d1e71d840f863082.png)
МБ (размер одного символа в Unicode - 2 байта, среднее число букв в слове - 20, среднее число слов - 40 тыс., среднее число значений - 15), где
![$n_{w}$ $n_{w}$](https://dxdy-04.korotkov.co.uk/f/f/e/5/fe59ae20757bf8e2dae5b30dccd45f0d82.png)
- среднее кол-во букв в слове,
![$n_{l}$ $n_{l}$](https://dxdy-04.korotkov.co.uk/f/f/7/2/f72524168209d7a8240c3bdfcaa1cdf982.png)
- среднее число букв в слове,
![$n_{s}$ $n_{s}$](https://dxdy-02.korotkov.co.uk/f/9/0/e/90e6fee2192298a5f73143e0be53f2b582.png)
- среднее число значений, соответствующих одному слову,
![$V_{wl}$ $V_{wl}$](https://dxdy-04.korotkov.co.uk/f/3/e/0/3e0d15dade559f0973043581462becf782.png)
- размер одного словаря (в байтах).
Объём всех словарей при 4970 словарях будет равен
![$V_{1}=m_{1}V_{wl}=4970\cdot 25 \approx 122$ $V_{1}=m_{1}V_{wl}=4970\cdot 25 \approx 122$](https://dxdy-02.korotkov.co.uk/f/d/7/b/d7b2bec0c100e2098bad92f46166c2a282.png)
ГБ.
Объём всех словарей при 140 словарях будет равен
![$V_2=m_{2}V_{wl}=140\cdot25 \approx 4$ $V_2=m_{2}V_{wl}=140\cdot25 \approx 4$](https://dxdy-03.korotkov.co.uk/f/6/e/6/6e6afb01c38722b02611825bb372cd7682.png)
ГБ.
Всего при таком раскладе для хранения большего числа словарей потребуется в
![$\frac {V_1} {V_2} \approx 30.5$ $\frac {V_1} {V_2} \approx 30.5$](https://dxdy-02.korotkov.co.uk/f/9/9/6/9960164239454c5286daf545717f601c82.png)
раз больше места на сервере.
И вот заключительный вопрос: почему Google такой жмот? Разве 122 ГБ нельзя было выделить для хранения словарей? На серверах у них вон сколько места... Или уменьшение количества словарей связано не с экономией места на сервере, а по другим причинам?
З.Ы. Просто я иногда наблюдал, что если GT не смог перевести слово в предложении с одного языка на другой, то я видел, что GT показывал перевод слова с данного языка на английский.
З.З.Ы. Я брал лишь приближённые средние значения для кол-ва букв в одном слове, слов и значений. Для каждого языка средние значения кол-ва букв в слове и слов могут быть разными.