Как известно, GT переводит с одного языка на другой не напрямую, а сначала переводит на английский с одного языка, а потом с английского на другой язык. Данный метод хорош тем, что словари занимают меньше места на сервере, ведь кол-во словарей вида "язык1-английский" и "английский-язык1" было бы меньше, чем кол-во словарей вида "язык1-язык2", и сейчас я это докажу.
Кол-во словарей вида "язык1-язык2" найдём по кол-ву размещений по 2 элемента (по 2 языка). Всего в GT 71 язык, тогда
, где
- кол-во словарей вида "язык1-язык2",
- кол-во языков в GT.
Кол-во словарей вида "язык1-английский" и "английский-язык1" вместе взятых найдём по формуле
(английский язык мы не учитываем в качестве второго в паре с английским языком), где
- кол-во словарей вида "язык1-английский" и "английский-язык1" вместе взятых.
Размер одного словаря (в байтах) будет равен
МБ (размер одного символа в Unicode - 2 байта, среднее число букв в слове - 20, среднее число слов - 40 тыс., среднее число значений - 15), где
- среднее кол-во букв в слове,
- среднее число букв в слове,
- среднее число значений, соответствующих одному слову,
- размер одного словаря (в байтах).
Объём всех словарей при 4970 словарях будет равен
ГБ.
Объём всех словарей при 140 словарях будет равен
ГБ.
Всего при таком раскладе для хранения большего числа словарей потребуется в
раз больше места на сервере.
И вот заключительный вопрос: почему Google такой жмот? Разве 122 ГБ нельзя было выделить для хранения словарей? На серверах у них вон сколько места... Или уменьшение количества словарей связано не с экономией места на сервере, а по другим причинам?
З.Ы. Просто я иногда наблюдал, что если GT не смог перевести слово в предложении с одного языка на другой, то я видел, что GT показывал перевод слова с данного языка на английский.
З.З.Ы. Я брал лишь приближённые средние значения для кол-ва букв в одном слове, слов и значений. Для каждого языка средние значения кол-ва букв в слове и слов могут быть разными.