Коды данных в моём понимании это все коды, в том числе и программные
В контексте ML, "ошибка в коде" ("код" в единственном числе) общепринято синонимична к "неправильно написанная программа".
На этом предлагаю перестать обсуждать лингвистику, и вернуться к содержательному аргументу
Сравните частоту, с которой это происходит на практике из-за ошибок в коде и ошибок железа
Если данные повреждаются или просто модели обучаются неправильно сильно чаще из-за неправильно написанных программ, то думать о сбоях железа (что приведет к усложнению программ, и, соответственно, увеличению количества ошибок в них) контрпродуктивно.
Кроме того,
значительная часть современных электронно-вычислительных устройств не использует никаких способов проверки данных
нуждается в доказательствах. Где статистика?