2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 14:34 
Заморожен


10/11/08
303
Челябинск
Здравствуйте! У меня возник такой вопрос. Какова вероятность ошибки при работе CPU? Допустим, компьютер неделю без остановки проверял некоторое очень большое натуральное число на простоту. Какова вероятность того, что все эти вычисления пошли насмарку из-за одной (или больше) ошибки CPU? Я имею ввиду ошибки связанные не с косяками микроархитектуры или кода, а ошибки, связанные, например, с выходом (временным или нет) из строя какого-нибудь триггера или блока триггеров.

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 15:29 
Заблокирован
Аватара пользователя


07/08/06

3474
Можно посмотреть в сторону программки Prime95 (подробнее). Как-то я пробовал разогнать процессор, она ошибки отлавливала очень хорошо, хотя на первый взгляд система работала стабильно.

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 16:58 
Заморожен


10/11/08
303
Челябинск
AlexDem в сообщении #688445 писал(а):
она ошибки отлавливала очень хорошо, хотя на первый взгляд система работала стабильно.

А какой природы эти ошибки?

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 17:14 
Заблокирован
Аватара пользователя


07/08/06

3474
Не совсем понял вопрос. Эта программа вычисляет результат и сравнивает с известным ей ответом, если не совпадает -- значит где-то возникла ошибка. В регистрах процессора может, или в памяти. Почитайте описание.

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 17:19 
Заморожен


10/11/08
303
Челябинск
Я понимаю это. Но меня интересует природа этих ошибок. Часто ли возникают ошибки, скажем, в результате того, что некий транзистор на кристалле процессора не срабатывает?

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 17:22 
Заблокирован
Аватара пользователя


07/08/06

3474
Если процессор не разогнан, никаких ошибок быть вообще не должно. Программа и позволяет в какой-то мере это проверить. На уровне транзисторов не могу ничего сказать -- не в курсе.

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 17:55 
Заслуженный участник


04/05/09
4582
AlexDem в сообщении #688488 писал(а):
Если процессор не разогнан, никаких ошибок быть вообще не должно.
Не совсем. Если процессор не разогнан, то вероятность ошибки меньше регистрируемой. Собственно, так произведённые процессоры и маркируют по частоте: выполняет некоторый набор тестов на какой-то частоте без ошибок - ставят несколько меньшую частоту для запаса надёжности.

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 18:53 
Заблокирован
Аватара пользователя


07/08/06

3474
Когда я экспериментировал, то с понижением частоты количество ошибок постепенно понижалось, а при достижении нормального режима работы дождаться их появления не удавалось. Видимо, там какая-то сильно нелинейная зависимость надёжности от частоты. Может, процессор раньше заржавеет :-)

-- Вт фев 26, 2013 19:56:53 --

Кстати, можно тогда ещё попробовать подразогнать процессор и посмотреть, есть ли запас прочности.

-- Вт фев 26, 2013 20:12:56 --

Смотрите, чего нашёл: Эмпирический анализ аппаратных сбоев на миллионе ПК

 Профиль  
                  
 
 Re: Какова вероятность физической ошибки при работе CPU?
Сообщение26.02.2013, 19:18 
Аватара пользователя


31/10/08
1244
http://www.cs.toronto.edu/~bianca/paper ... rics09.pdf
Вот ещё одно исследование.

-- Вт фев 26, 2013 20:49:19 --

Цитата:
Я имею ввиду ошибки связанные не с косяками микроархитектуры или кода, а ошибки, связанные, например, с выходом (временным или нет) из строя какого-нибудь триггера или блока триггеров.

Что хочу сказать. В компьютере предусмотрена защита от сбоев.
К примеру на шинах USB, E-PCI, SATA используется избыточное кодирование 8b/10b.
В RAM используется ECC кодирование для коррекции сбоев. Правда не во всех планках. В основном такие планки ставят в сервера уровня предприятия.
Не уверен но насколько знаю в кэше процессора обязательно встроен ECC.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 9 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group