39980

Общие средства повышения надежности

Контрольная

Информатика, кибернетика и программирование

Общие средства повышения надежности Надежность это вероятность безотказной работы какоголибо устройства в течение заданного срока службы. Эту вероятность они называют надежностью. Для оценки важности понятия надежность нам придется вести довольно тривиальный разговор о сложности мира машин и приборов. Надежность машин зависит от множества причин: и от материалов используемых для их изготовления и от станочного оборудования и от условий эксплуатации и от заводского контроля и от мастерства рабочих и конечно от конструкторских идей...

Русский

2013-10-13

22.51 KB

7 чел.

18. Общие средства повышения надежности

Надежность это вероятность безотказной работы какого-либо устройства в течение заданного срока службы.

Если испытать несколько электроламп одного и того же типа и из одной партии на срок службы, то окажется, что каждая из них работает разное время. Заранее сказать, какова величина безотказного времени работы той или иной лампы, нельзя. Можно только указать, сколько в среднем ламп из очень большого их числа проработает не меньше заданного срока.

Иными словами, для каждой лампы, так же как и для каждого другого изделия, срок службы - случайная величина. Ученые и должны вычислить вероятность безотказной работы устройства в течение заданного срока службы. Эту вероятность они называют надежностью. 
Для оценки важности понятия «надежность» нам придется вести довольно тривиальный разговор о сложности мира машин и приборов.

В типовом электронном устройстве от 60 до 90 деталей. А например, бортовая аппаратура авиалайнера содержит десятки тысяч электронных устройств. И вся эта сложнейшая аппаратура должна работать длительное время в условиях значительных перегрузок, вибраций, резких изменений температуры и давления.

Надежность подобных комплексов определяется самым слабым его элементом. Тем, который скорее всего выйдет из строя. А как знать, какая же из множества деталей окажется самой слабой?

Если элемент в среднем может проработать безотказно 10 тысяч часов, то даже тогда за каждые две минуты можно ждать одной неисправности, одного отказа в работе.

Выходит, чем сложнее система, тем она менее надежна. Надежность машин зависит от множества причин: и от материалов, используемых для их изготовления, и от станочного оборудования, и от условий эксплуатации, и от заводского контроля, и от мастерства рабочих, и, конечно, от конструкторских идей, заложенных в проект машины.

Надежность каждого элемента в машине влияет на ее надежность в целом. Испытывали один из образцов вычислительной машины. Результаты были малоутешительными, она не соответствовала требованиям надежности. Стали искать причину. Оказалось, что недостаточно надежны самые массовые детали - непроволочные сопротивления.

Для изготовления этой простой детали нужно было девять материалов: керамика, латунь, эмаль, абразивные камни и другие. Каждая деталь проходила двенадцать технологических операций, любая из них влияла на надежность.

В образце машины, проходившей испытания, было около 600 тысяч непроволочных сопротивлений. Подсчитаем теперь, сколько же факторов влияло на надежность этой машины только от одних сопротивлений:600 000 * 9 * 12 = 64 800 000! А ведь в машине были тысячи других деталей.

Надежность работы сложных систем и машин для каждой отрасли определяется по-своему. В измерительных приборах ее определяет точность показаний, в гидрооборудовании - безотказность при разных режимах работы. Надежность же компьютерной техники определяют точность приема, обработки и выдачи готовой информации. Если работа вычислительного устройства ненадежна, жди ошибок, искажений.

Степень надежности изделий и систем определяют по показателям так называемого «отказа», то есть по нарушению работоспособности. Отказы бывают постепенные и внезапные. А для систем передачи и переработки информации характерны «сбои», то есть самоустраняющиеся отказы, когда случайная ошибка в вычислительном оборудовании или в вычислительной системе устраняется автоматически.

Постепенные отказы проявляются постепенно, по мере отхода системы или устройства от установленных допусков. В таких случаях даже пользуются специальным понятием - среднее время до появления сбоя. Внезапные же отказы проявляются сразу, при резком изменении параметров, определяющих правильную работу системы.

Существует специальная методика исследования надежности. Большую роль в ней играет теория вероятностей, математическая статистика, теория информации, теория массового обслуживания. Вопросами надежности, анализом надежных систем занимаются на всех этапах создания системы - от проектирования до испытания и эксплуатации.

Всеми возможными средствами стараются ученые, конструкторы и инженеры увеличить надежность - показатель доверия к машине. И ныне надежность достаточно высока: авиадвигатели, например, рассчитаны на 20 тысяч часов работы, самолеты гражданской авиации и крупные технологические комплексы - до 20 лет, тепловые энергоустановки - до 40 лет.

В борьбе за надежность применяют и самые современные способы проектирования, и лучшие материалы, и совершенные технологии, и тончайшую диагностику, и новейшие методы ремонта машин, и грамотную эксплуатацию. Но надо помнить, что борьба за надежность - процесс бесконечный, что проблема надежности, решенная сегодня, по-новому возникнет завтра, так как используемые человеком технические средства все время совершенствуются.

Важнейшей характеристикой вычислительных систем является надежность. Повышение надежности основано на принципе предотвращения неисправностей путем снижения интенсивности отказов и сбоев за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечение тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры.

Отказоустойчивость - это такое свойство вычислительной системы, которое обеспечивает ей, как логической машине, возможность продолжения действий, заданных программой, после возникновения неисправностей. Введение отказоустойчивости требует избыточного аппаратного и программного обеспечения. Направления, связанные с предотвращением неисправностей и с отказоустойчивостью, - основные в проблеме надежности. Концепции параллельности и отказоустойчивости вычислительных систем естественным образом связаны между собой, поскольку в обоих случаях требуются дополнительные функциональные компоненты. Поэтому, собственно, на параллельных вычислительных системах достигается как наиболее высокая производительность, так и, во многих случаях, очень высокая надежность. Имеющиеся ресурсы избыточности в параллельных системах могут гибко использоваться как для повышения производительности, так и для повышения надежности. Структура многопроцессорных и многомашинных систем приспособлена к автоматической реконфигурации и обеспечивает возможность продолжения работы системы после возникновения неисправностей.

Следует помнить, что понятие надежности включает не только аппаратные средства, но и программное обеспечение. Главной целью повышения надежности систем является целостность хранимых в них данных.

Сравнительный анализ надёжности миллиона компьютеров развеял заблуждения

Автор: Андрей Васильков
Опубликовано 27.06.2012 в 
блоге автора (rss)

У каждого из нас свой опыт работы с компьютерами, который сформировал индивидуальное представление об их особенностях и надёжности. Большая часть людей имела дело с единичными экземплярами, увлечённые гордо ведут счёт на десятки и редкий специалист может честно сказать, что работал с сотнями разных моделей. По сравнению с объёмом ежегодно выпускаемых компьютеров это всё капли в море. Такое соотношение приводит к тому, что даже ИТ-гуру могут сильно заблуждаться, поскольку в своих суждениях исходят преимущественно из частных случаев. Говоря языком статистики, проблема кроется в привычке делать выводы о компьютерах в целом на основе личной нерепрезентативной выборки. 

Попытку применить научный подход и непредвзято проанализировать причины аппаратных сбоев компьютеров пользователей предпринял исследовательский центр Microsoft, собрав при помощи утилиты Windows Error Reporting отчёты об ошибках с одного миллиона устройств. Рассматривались сбои в дисковой подсистеме, ошибки ЦП и ОЗУ. В эту выборку попали ноутбуки и компьютеры разных производителей и годов выпуска, работающие на штатных, повышенных и пониженных частотах. Вся совокупность отчётов учитывает только случаи критических сбоев.
 
Ранее многие компании проводили подобные исследования для корпоративного сегмента, однако их результаты нельзя просто экстраполировать на домашних пользователей. В отличие от серверов, персональные компьютеры не оснащены технологиями коррекции ошибок.

Анализ показал, что большинство сбоев было повторяющимися и взаимосвязанными. Частота ошибок ЦП напрямую коррелирует с числом выполненных им циклов. При общем времени работы 120 часов средняя вероятность сбоя ЦП составляет 1:330, а по мере увеличения до 720 часов возрастает до 1:190. Устройства, работающие на пониженных частотах, предсказуемо оказались более надёжны, чем работающие на повышенных или даже штатных. При разнице в частотах более 5 процентов вероятность сбоев ЦП и ОЗУ отличается на 25–45 процентов.

Ноутбуки в целом продемонстрировали более высокую надёжность, чем настольные компьютеры: случаи аппаратных проблем во всех подсистемах у них регистрировались в полтора-два раза реже. 

Разница между надёжностью брэндовых и остальных компьютеров была выявлена только для подсистемы памяти. ОЗУ в компьютерах известных производителей демонстрировала втрое меньшую склонность к аппаратным отказам.

Показатель MTTF (mean time to fail – время средней наработки на отказ) оказался бесполезным для персональных компьютеров. Он имеет смысл только при возможности дублировать критические узлы системы и перераспределять нагрузку, чего как раз лишён домашний пользователь. Анализ показал, что после возникновения первого сбоя значение MTTF падает на два порядка — с 6,5 лет до 13,5 дней.

Исследователи делают вывод, что аппаратные проблемы можно решать программным путём. Для персональных компьютеров целесообразно разработать ОС, которая будет изначально устойчива к наиболее частым аппаратным проблемам. Например, сможет переназначать повреждённые ячейки ОЗУ подобно тому, как контроллер жёсткого диска переназначает сбойные секторы. В многоядерных системах ОС может переносить выполнение кода на стабильно работающие ядра или нивелировать ошибки за счёт избыточных параллельных вычислений.


 

А также другие работы, которые могут Вас заинтересовать

35025. Датчики случайных чисел 811.54 KB
  В ряде шифровальных алгоритмов используется бесконечная гамма случайных чисел, обладающих рядом качеств и параметров (диапазон изменений, максимальное и минимальное значение, частотность и другие).
35026. Система шифрования Цезаря 1.09 MB
  Криптография представляет собой совокупность методов преобразования данных, направленных на то, чтобы сделать эти данные бесполезными для противника. Такие преобразования позволяют решить две главные проблемы защиты данных: проблему обеспечения конфиденциальности (путем лишения противника возможности извлечь информацию из канала связи)
35027. Алгоритм шифрования XOR 131.96 KB
  XOR – это функция булевой алгебры, носящей название «исключающее или», данная функция используется для работы с данными представленными в двоичной системе исчисления. Основным достоинством, позволяющим использовать эту функцию в шифровальных алгоритмах является ее обратимость, при отсутствии потери информации.
35028. ФОРМИРОВАНИЕ ИНСТИТУТА АДВОКАТУРЫ В КОНЦЕ XVIII - НАЧАЛЕ XIX ВВ. ВО ФРАНЦИИ, ГЕРМАНИИ И РОССИИ 118 KB
  Внутриорганизационные правоотношения в сфере деятельности адвокатской корпорации и правоотношения, возникавшие по поводу правового статуса адвоката в период становления адвокатуры в России, Германии и Франции.
35029. Основы работы в AutoCAD 1.16 MB
  На сегодняшний день AutoCAD – самая мощная система автоматизированного проектирования (САПР) из тех, что могут работать на персональных компьютерах. Она способна выполнять практически все виды чертежных работ, необходимых в разнообразных областях технического проектирования.
35030. Настройка линейных и угловых единиц измерения 1.19 MB
  В AutoCAD при вычерчивании линий, а также объектов, состоящих из сегментов линий, используется одна из пяти систем линейных единиц. Угловые величины также могут измеряться в одной из пяти систем. Пользователь может выбрать самостоятельно как тип линейных
35031. Защита баз данных на примере MS ACCESS 441.3 KB
  Для защиты БД Ассеss использует файл рабочих групп systеm.mdw (рабочая группа - это группа пользователей, которые совместно используют ресурсы сети), к которому БД на рабочих станциях подключаются по умолчанию. Файл рабочих групп содержит учётные записи пользователей и групп, а также пароли пользователей.
35032. CADElectro + Search 190.5 KB
  Архивное хранилище документов [2. Различные типы документов [2. Согласование и утверждение документов [2. Проведение изменений утвержденных документов [2.
35033. Системы автоматизированного проектирования ЕLECTRICS Light 1.0. 50 KB
  К существенным преимуществам системы заметно отличающим ее от программ аналогичного назначения следует отнести: прямой расчет освещенности с использованием кривых силы света светильников с отслеживанием затенений и отражений от поверхностей; возможность расчета освещенностей в помещениях произвольной конфигурации прямоугольной овальной Г или Tобразной и т.; получение сводного результата по расчету множества помещений и всего здания проекта; возможность детального анализа распределения освещенности по области расчета построение...