„Miękkie błędy” - niewytłumaczalne problemy z komputerem

„Miękkie błędy” - niewytłumaczalne problemy z komputerem

Przeczytaj w Wired i postanowił przetłumaczyć. Artykuł oczywiście znajduje się na poziomie Komsomolskaya Pravda, ale może być interesujący

Mniej więcej rok temu Stephen Jakisa miał poważne problemy z komputerem. Zaczęli, gdy zainstalował Battlefield 3 - pierwszą strzelankę -osobową, w której akcja odbywa się w najbliższej przyszłości. Wkrótce problemy były nie tylko w grze, ale jego przeglądarka „wyleciała” co około 30 minut. W rezultacie nie mógł nawet zainstalować żadnych programów na swoim komputerze.

Doszło do tego, że Stephen jest z zawodu programistą, a osoba, która była dość zorientowana w technologii, zdecydował, że „złapał” wirusa lub, być może zainstalował oprogramowanie z poważnymi błędami. Z problemem postanowił zwrócić się do swojego przyjaciela Johna Stefanoviciego, który właśnie pisał rozprawę o niezawodności komputerów.

Po krótkiej diagnozie Stephen i John ujawnili problem - zły układ pamięci na komputerze Jakis. Ponieważ komputer działał idealnie przez około sześć miesięcy przed problemem, Stephen nie podejrzewał awarii sprzętu, dopóki jego towarzysz nie przekonał specjalnego testu do analizy pamięci. Dla Stephena było to dość niezwykłe. Jak sam powiedział: „Gdyby stało się to z kimś na ulicy, z kimś, kto nic nie wie o komputerach, prawdopodobnie byłby w ślepym zaułku”.

Po tym, jak Jakisa wydobyła problematyczny moduł pamięci, jego komputer działa dobrze.

Kiedy komputery pękają z reguły, wierz, że problemy z oprogramowaniem. Jednak w ciągu ostatnich kilku lat informatycy zaczęli zwracać coraz więcej uwagi na niepowodzenia sprzętowe i doszli do wniosku, że problemy z nich występują znacznie częściej niż wielu ludzi uważa.

Miękkie błędy

Niebieski ekran śmierci w systemie Windows 8

Producenci mikrofonu wykonują poważne prace nad testowaniem ich układów przed wypuszczeniem ich na sprzedaż, ale nie lubią mówić o tym, że dość trudno jest zapewnić stan roboczy mikrokręgów przez długi czas przez długi czas. Od późnych lat 70. ubiegłego wieku producenci CHIP wiedzą, że szereg problemów ze sprzętem może być spowodowane zmianą stanu bitów w mikroprocesorach. Wraz ze spadkiem wielkości tranzystorów, zachowanie naładowanych cząstek w nich staje się mniej przewidywalne. Producenci nazywają takie błędy „błąd miękki”, chociaż nie są one powiązane z oprogramowaniem.

Jednak te miękkie błędy - stanowią tylko część problemu: w ciągu ostatnich pięciu lat naukowcy, badanie złożonych i dużych systemów komputerowych, doszli do wniosku, że w wielu przypadkach używane sprzęt komputerowy jest po prostu zepsuty. Wady wysokiej temperatury lub produkcji mogą prowadzić do faktu, że elementy elektroniczne zawodzą w czasie, umożliwiając swobodne przepływ elektronów między tranzystorami lub kanałami układu zaprojektowanego do przesyłania danych.

Naukowcy uczestniczący w opracowywaniu układów komputerowych następujących pokoleń wykazują poważną troskę o takie błędy i jeden z głównych aspektów tego problemu - energia. Jako kolejna generacja komputerów, nabywają coraz większą liczbę mikrokręgów i wszystkich mniejszych komponentów. I w ramach tych maleńkich tranzystorów konieczne jest coraz więcej energii, aby utrzymać w nich nietoperze.

Problem jest związany z fundamentalną fizyką. Ponieważ producenci mikrokręgów wysyłają elektrony przez coraz mniejsze kanały, elektrony po prostu wybijają z nich. Im mniejsze kanały, tym więcej elektronów może „wyciekać”, a im więcej energii jest wymagane do normalnego funkcjonowania komputerów. Ten problem jest tak skomplikowany, że Intel działa razem z Departamentem Energii USA i innymi instytucjami rządowymi, aby go rozwiązać. W przyszłości Intel planuje zastosować 5-nm proces technologiczny do produkcji mikrokręgów, które będą ponad 1000 razy wyższe w wynikach przez osoby oczekiwane do końca tej dekady. Wydaje się jednak, że takie układy będą również wymagały niesamowitej ilości energii.

„Wiemy, jak zrobić takie układy, jeśli nie martwisz się zużyciem energii”, mówi Mark Seager, główny dyrektor ekosystemów obliczania wysokiej wydajności w Intel, „ale jeśli poprosisz nas o odpowiedź na to pytanie, to ponad nasze możliwości techniczne ".

Dla zwykłych komputerów, takich jak Stephen Jakis, świat takich błędów jest nieznanym obszarem. Producenci chipów nie lubią rozmawiać o tym, jak często ich produkty są nieprawidłowe, woląc zachować tę informację w tajemnicy.