i Del 1 og del 2 i denne fejlanalyseserie diskuterede vi, hvor fejl kommer fra, og hvilke værktøjer du vil have i dit værktøjssæt til at adressere dem. Nu kommer den hårde del: at sætte alle disse værktøjer til at arbejde. I sin kerne handler fejlanalyse om at identificere, hvilket sæt input der fik et output til at mislykkes, og hvilke korrigerende handlinger du vil tage for at løse det. Så hvis du gjorde alt det hårde arbejde for at finde og identificere fejl, lad os dykke ned i nogle trin, du kan tage for at starte din proces.
typisk finder du fejl under en build eller i pålidelighedstest og har kun kort tid til at finde og rette dem. Når du bliver opmærksom på problemet, skal du stille dig selv følgende spørgsmål for at organisere dine tanker, når du udfører en fejlanalyse:
- Hvad er failure mode?
- hvor kritisk er fejlen?
- er fejlen gentagelig?
- Hvad er din hypotese?
- er der andre potentielle faktorer?
- hvilke data Har du?
- hvilke data Har du brug for?
- har du nogen foreslåede løsninger?
- har du en måde at teste dine løsninger på?
- påvirker din løsning et andet team?
- vil der være utilsigtede konsekvenser?
for at illustrere en typisk fejlanalyse vil vi gennemgå spørgsmålene ovenfor i et eksempelscenarie.
- eksempel: bærbart Fitnesssporingsur
- Hvad er fejltilstanden?
- hvor kritisk er fejlen?
- er fejlen gentagelig?
- Hvad er din hypotese?
- er der andre potentielle faktorer?
- hvilke data Har du til fejlanalyse?
- hvilke data Har du brug for til fejlanalyse?
- har du nogen foreslåede løsninger?
- har du en måde at teste dine løsninger på?
- påvirker din løsning et andet team?
- vil der være utilsigtede konsekvenser?
- gennemgang af dette fejlanalyseeksempel:
- overvågning af korrigerende handlinger
- konklusion
eksempel: bærbart Fitnesssporingsur
et nyt bærbart fitnessur evalueres ved dets EVT-build. Under opbygningen dukker et par små problemer op, men generelt fungerer enhederne. Men efter bygningen er der fundet en fejl under drop test. Så begynder fejlanalysen.
Hvad er fejltilstanden?
nogle gange er det let at finde en fiasko, men oftere kan du kun se symptomer på en fiasko og kan ikke være sikker på, hvad grundårsagen faktisk er. I vores ureksempel finder vi, at en drop test-begivenhed får skærmen til at mislykkes i 6 ud af 10 testede enheder. Det, vi ved, er, at noget gik galt med skærmen efter drop-begivenheden, men vi ved endnu ikke, hvorfor fejlen opstod. Vi begynder med at undersøge, hvilken tilstand enheden er i.
- er fejltilstanden til stede på samme måde på de mislykkede enheder?
- hvis der er forskellige slags displayfejl, kan drop-begivenheden have udsat flere fejltilstande, som hver kan have en lidt anden grundårsag.
- blev skærmen hvid?
- er der linjer i bestemte rækker eller kolonner?
- knækkede dæklinsen?
- knækkede skærmen?
- ser resten af enheden ud til at fungere? – Opladning, motorer, berøring osv?
- hvad var de specifikke tests, der mislykkedes?
- hvilken højde faldt uret fra?
- hvilket substrat blev enheden faldet på?
- hvilken orientering opstod fejlene?
- er der andre åbenlyse problemer, der kan observeres?
- er der nogen mekanisk skade på enhedens omkreds?
efter omhyggelig forhør af prøverne finder vi, at 4 af de 6 fejl kom fra test udført på et granitsubstrat, og 2 kom fra spånpladesubstratet, der alle faldt fra bordhøjde på 1 meter. På 5 af fejlene bliver displayet hvidt og forbliver ikke reagerende. Den 6. fejl, dæklinsen knækkede, men viste stadig billeder. På 2 af enhederne kan vi muligvis se nogle scuff-mærker på dæklinsen, og på 3 af enhederne er der nogle ridser på huset på den ene kant.
hvor kritisk er fejlen?
fejl varierer i sværhedsgrad fra lav til høj og mange niveauer imellem. Nogle gange, hvad der synes at være et mindre problem balloner til noget større. En typisk bærbar vil blive brugt og misbrugt af dens ejer. Hver gang brugeren tager uret af, er en potentiel mulighed for en drop-begivenhed. I dette tilfælde virker en dråbefejl, hvor skærmen ikke reagerer, som et kritisk problem at løse. En ikke-reagerende skærm ville gøre enheden ubrugelig og ville resultere i både en høj returrate og utilfredse kunder. Dette problem fortjener opmærksomhed og bør løses, før programmet går videre til de næste trin.
er fejlen gentagelig?
repeterbarhed betyder, at den samme proces kan fremkalde en fejl konsekvent. For de bærbare mislykkedes 6 ud af 10 enheder og 5 af disse 6 på samme måde. Dette antyder, at en fiasko kunne gentages, og den resterende fiasko sandsynligvis var et engangsproblem, som vi skulle overvåge, men ikke tackle på dette tidspunkt. Alligevel er vi nødt til at finde ud af, om det ikke-reagerende displayproblem virkelig kan gentages ved at grave i dataene lidt dybere.
- opstår fejlen i samme dropretning?
- Drop testsekvenser udføres normalt på samme måde hver gang. Det kan starte med forsiden, så bagsiden, så de 4 sideflader, så hjørnerne. Hvis det forreste ansigtsfald altid forårsager problemet, forbliver det uklart, om fejlen skyldes den særlige orientering af et frontalt ansigtsfald, eller om problemet ville opstå fra ethvert fald i samme højde.
- for at bekæmpe dette skal pålidelighedsteamet teste flere enheder ved hjælp af en anden sekvens eller placere den mislykkede retning sidst.
- havde alle de mislykkede enheder det samme vandfald af pålidelighedstest før fejlen?
- i en god pålidelighedstestplan udføres miljøtest ofte først for at forudsætte enhederne. Nogle vil blive sat gennem varme suge eller temperatur cykling test, som kan chokere systemet eller svække klæbende bindinger.
- hvis fejlen opstår på friske enheder og på forudbestemte enheder, ser fejlen ud til at være et lokaliseret problem. Hvis ikke, skal vi muligvis forstå, hvilke forhold produktet blev udsat for inden drop-testen.
Hvad er din hypotese?
for vores ur kan der være 2 eller flere underliggende problemer. Den første er, at skærmen bliver hvid og forbliver ikke reagerer. Vi kan udlede, at strømmen er blevet afbrudt fra systemet, hvilket ville pege på et problem med selve skærmen, skærmstikket eller en mekanisk påvirkning eller tåre på skærmkablet. Alternativt kan forbindelsen til batteriet eller strømstyringen få enheden til at mislykkes.
er der andre potentielle faktorer?
ofte har udfordrende fejl mange årsager, der gør det vanskeligt klart at identificere, hvor du skal fokusere din tid. Hvis du har problemer med dine indledende hypoteser under fejlanalyse, brainstorm en liste over mulige områder at undersøge.
i den bærbare er EVT-bygningen første gang, vi sætter noget sammen. Ofte fremstilles underkomponenter som displaymodulet og andre hovedkomponenter med parametre, der endnu ikke er afsluttet. Som sådan kan stikkene, displayet eller den mekaniske samling alle bidrage til displayfejlen.
for at udelukke andre fejlkilder skal vi muligvis sortere gennem fremstillingsprocesparametre, måledata, samlingsbilleder. Vi bliver muligvis nødt til at dykke dybere ned i vores opstrømsleverandører for at lede efter yderligere oplysninger. Lad os i dette eksempel antage, at skærmen var en standardkomponent i produktion i lang tid, hvilket antyder, at der ikke kommer nogen større displayændringer, og at vi skal fokusere på det mekaniske design.
hvilke data Har du til fejlanalyse?
i pålidelighedsfejl i den bærbare, bør vi samle alle de tilgængelige oplysninger, vi har adgang til, som kan hjælpe os med at verificere vores hypoteser. Da fejlen opstod under en mekanisk test, skal vi starte med fysisk at inspicere de mislykkede enheder og gennemgå alle før og efter fotos og testens højhastighedsvideo, især i retning af fiasko.
vi leder efter nogen åbenlyse deformationer eller pauser. Hvis det er muligt, bør vi inspicere nogle af de mislykkede enheder og åbne dem for at se, om vi kan finde noget galt på indersiden. De før og efter billeder af enhederne vil vise os, hvis der var noget åbenbart galt med forsamlingen før drop. Højhastighedsvideoen giver os mulighed for at observere komprimeringen og strækningen af det materiale, der sker hurtigere end et øjeblik. Hvis displayet og huset bevæger sig i modsatte retninger efter påvirkning, kan der være noget, der er værd at undersøge yderligere.
derudover vil vi gerne gennemgå rapporten om displaymodulerne og måle FAI/Cpk-rapporter for de vigtigste dele af samlingen, herunder det mekaniske hus. Vi ser på, hvordan de faktiske dele sammenlignes med de dimensioner og tolerancer, vi brugte i vores indledende toleranceanalyser.
hvis vi kombinerer disse datasæt, skal vi være i stand til at forfine vores oprindelige hypotese og tænke over, hvilke data vi mangler, når vi fortsætter vores fejlanalyseundersøgelse.
hvilke data Har du brug for til fejlanalyse?
mens vi har fysisk adgang til enhederne, ved vi stadig ikke, hvad der er galt, før vi nedbryder enhederne. Når vi åbner 3 ure, fandt vi ud af, at board-to-board-stikkene på 2 ud af 3 var løsnet. Den sidste, vi var ude af stand til at adskille ordentligt og kunne ikke fortælle, hvad konnektorens tilstand var. Men da 2 af dem, vi åbnede, viste det samme problem, vil vi undersøge, hvorfor stikket løsnede.
vi vil gerne gennemgå vores simuleringer for at fokusere på de kræfter, der opleves af stikket og andre parringskomponenter. Vi bør også gennemgå forbindelsesspecifikationen for kraftopbevaring og uafhængigt kontrollere, at stikkene på disse skærme og hovedkredsløbet opfylder eller overstiger specifikationen. Det er også muligt, at sælgeren brugte en billig version af stikket eller endda det forkerte stik af forskellige årsager, så vi vil gerne bekræfte konnektorens lotkoder og varenumre.
vi skal muligvis teste flere enheder for at se, om forskellige displayleverandører eller andre konfigurationer fungerer på samme måde.
har du nogen foreslåede løsninger?
i vores bærbare er vi indsnævret på displaystikket og den mekaniske samling, der omgiver det som et interesseområde. Holdet brugte lidt tid på at analysere forsamlingen og foreslog et par løsninger. Disse omfatter:
- tilføjelse af et lille stykke komprimerbart skum over stikket for at optage luftgabet mellem stikket og hovedhuset.
- brug af en epoksisharpiks til stikket, når det er på plads.
- tilføjelse af en metalbeslag og nogle skruer for sikkert at fastgøre stikket på plads.
- ændring af stikket på displayet FPC og bestyrelsen.
hver af disse løsninger har sine fordele og ulemper og ville kræve yderligere arbejde for at teste. Vi kan eliminere mulighed 4, efter at operationsteamet fortæller os, at skærmen er en standardkomponent, og omkostningerne og leveringstiderne ville stige markant, hvis vi flyttede til et nyt stik.
de mekaniske løsninger kræver design-og monteringsændringer, der også kan have potentielle nedstrømseffekter på den mekaniske og elektriske ydeevne.
med skumopløsningen skal vi gennemgå størrelsen på spalten i den nominelle tilstand såvel som i dråbetesttilstanden for at vælge et passende materiale. Hvis skummet også trykker på undersiden af skærmen, skal vi sørge for, at det ikke skubber for hårdt bagfra for at forvrænge skærmen.
løsningen kunne være en hurtig løsning, men den kunne åbne en dåse orme om proceskonfigurationer og materialevalg. Derudover, når en komponent er blevet epokset, er det næsten umuligt at omarbejde, hvilket betyder, at når dette trin udføres på samlebåndet, hvis noget efterfølgende går galt, hele denne samling skal muligvis smides ud.
med metalbeslaget skal vi finde plads til at fastgøre beslaget og sørge for, at der ikke er nogen kortslutningsproblemer. Hvis vi fastgør det med skruer, bliver displayruten vanskeligere, da der sandsynligvis er mange spor i vejen.
har du en måde at teste dine løsninger på?
to af løsningerne kan være lette at prototype-skummet og epoksien. Begge har dog nogle risici, især efter at bygningen er afsluttet. Vi bliver nødt til at adskille nogle enheder for at tilføje skum eller Epoksi. Under demontering er der altid chancen for, at vi kunne introducere et andet problem, der er mere relateret til den ukontrollerede monteringsproces end den mulighed, vi prøver at undersøge. Men hvis prototyperne viser løfte, ville dette være en hurtig måde at få tillid til en løsning.
metalbeslaget kunne simuleres i CAD eller tilnærmes med nogle bearbejdede dele, men ville være vanskeligt at eftermontere funktionelt i det eksisterende hus. Fordi brættet skulle ændres for at rumme skruebosserne, og selve brættet ville have brug for huller boret igennem det, er det usandsynligt, at der kunne laves en fungerende prototype inden den næste bygning. Så i stedet kunne vi stole på kombinationen af en mekanisk mockup og simuleringer for at tilnærme, hvordan designændringen ville udføre.
påvirker din løsning et andet team?
alle rettelser til de bærbare påvirker andre hold. Det mindst forstyrrende for andre vil sandsynligvis tilføje skum bag stikket. Dette er en nem mulighed for at teste og kræver kun minimale ændringer eller evaluering af andre hold. Samtidig er det uklart, om skummet vil være nok til at forhindre, at stikket springer løs. Hvis skummet udøver for meget kraft på skærmen, kan det også virke imod os ved at tjene som et trykpunkt på skærmen under en dråbehændelse eller skade os ved at skubbe op på skærmen og udsætte kanterne på dæklinsen for edderkoppesprækker.
løsningen kræver investeringer i samleprocessen for at sikre, at løsningen kan udleveres korrekt. Flydende limprocesser er notorisk vanskelige at færdiggøre, så selvom det kan være værd at prototypere, håber vi måske ikke at bruge denne mulighed. Der ville også være et hit for prisen på produktet, da udbyttetab sandsynligvis vil være højere, og omarbejdning vil være vanskeligere.
pladebeslaget vil tage mest tid at implementere og kræve, at de elektriske hold skal layout bordsporene igen. Derudover skal vi vurdere, om metalskærmen ville forårsage utilsigtet stråling eller forstyrre trådløse signaler i produktet.
vil der være utilsigtede konsekvenser?
når du foretager designændringer for at løse et problem, er det let at blive fanget i det problem, du prøver at løse, og du kan glemme at evaluere designet for, hvad der ellers kunne gå galt. I dette eksempel er det muligt, at det at sætte huller i printkortet og bolte en beslag over stikket vil gøre dette område af brættet svagt, og i stedet for at stikket springer løs under en dråbetest, kan selve brættet gå i stykker og forårsage en større fejl end den, vi havde til hensigt at løse.
gennemgang af dette fejlanalyseeksempel:
gennem processen med at gennemgå de tilgængelige data, skabe hypoteser og teste har vi fundet den potentielle grundårsag til problemet. Vi formoder, at stikket oplevede mere kraft, end det blev vurderet til, og på grund af det designede luftgab mellem toppen af stikket og huset, ville løsne sig under drop-begivenheden, da luftgabet midlertidigt blev større. For at løse dette problem har vi identificeret 3 mulige løsninger til test og implementering. Hvilken vej Vi vælger at gå næste afhænger af, hvor godt løsningerne fungerer, og hvordan de potentielt påvirker tidsplanen og projektomkostningerne.
overvågning af korrigerende handlinger
når et handlingsforløb er valgt, skal teamet ikke kun gennemgå processen med at foretage designændringerne, men skal udvikle en plan for implementering og overvågning af løsningerne ved næste build.
for at bevare valgligheden kunne teamet beslutte at gå videre med designændringen for at tilføje beslaget og også forberede skummet. Dette ville medføre det lille tidsplan, der kræves af en værktøjsændring og layoutarbejde for det elektriske team, men ville give mulighed for at teste flere løsninger under bygningen, forhåbentlig at begrænse antallet af ekstra EVT-builds til kun en.
ved at vide, at der er en stor sårbarhed at teste, kan teamet arrangere bygningen for at prioritere dataindsamling til dette problem. Denne bygning kan omfatte konfigurationer af bare skum, bare metalbeslaget, og en, der inkluderer skummet og beslaget sammen.
forud for bygningen kunne teamet udføre en ny FMEA og forudsige, hvor potentielle problemer kan opstå fra de nye designs. Ved hjælp af FMEA som udgangspunkt kunne teamet sørge for flere kontrolstrin ved de kritiske transformationer, hvor ændringerne implementeres. Ingeniører på stedet bør også opfordres til at være opmærksom på bygningen ved disse trin.
for eksempel skal holdet observere, hvor svært det er at samle den nye beslag. Denne designændring kan kræve nye eller opdaterede jigs for at placere delen korrekt uden at beskadige nærliggende komponenter. Derudover kan de skarpe kanter på selve beslaget forårsage skade på bøjningskablet under montering eller pålidelighedstest, så vi bør kontrollere resultaterne af den funktionelle teststation tidligt for tegn på udbyttefald.
endelig skal vi sørge for, at den første batch af enheder fra den nye bygning tildeles til pålidelighedstest. Vi kan samarbejde med pålidelighedsteamet for at bestemme, hvor mange enheder der skal testes og bestå for at føle sig trygge i vores løsning. Mens bygningen er i gang, kunne vi få et klarere billede af, om en eller flere af konfigurationerne løser problemet, mens vi sørger for, at der ikke opstår nye problemer.
konklusion
det bærbare eksempel viser, at selv i relativt enkle problemer er der mange ting at overveje under fejlanalyse. Pålidelighedsrapporter, fysiske enheder, build-data og endda data fra opstrømsleverandører hjælper alle med at udfylde hullerne, når vi prøver at forstå, hvad der gik galt, og hvordan vi løser det.
i rigtige programmer står ingeniører over for mange forskellige problemer og skal løse dem alle parallelt. Ofte er der lidt tid til at udføre dybe dykanalyser på alle problemer inden næste build. Derfor er det vigtigt at fjerne små problemer hurtigt, så de kan fokusere på de kritiske udfordringer med en given arkitektur. Alle værktøjer, der kan hjælpe ingeniører med at indsamle og forbinde forskellige datasæt, er utroligt nyttige til at identificere potentielle årsager og arbejde igennem flere problemer på samme tid. Når en løsning er fundet, vil den blive undersøgt om omkostninger, hastighed og nem implementering, og alle vil have en anden mening om, hvad den bedste fremgangsmåde vil være. Selv efter at grundårsagen er fundet, og der foreslås en løsning, opretter dette bare en ny basislinje, hvorfra der kan opstå fejl. Den virkelige test vil være ved den næste bygning, fordi du kunne introducere en række utilsigtede konsekvenser. Denne proces gentages, indtil du løber tør for tid eller i en ideel verden, du løser alle problemerne.
Instrumental har skabt et unikt sæt værktøjer til at reducere friktionen involveret i hvert trin i fejlanalyse. Ved at indsamle produktdata og køre billeder gennem kunstig intelligens kan vi finde mulige uregelmæssigheder, før det er for sent at stoppe dem. Vi kan også gemme og spore vigtige data i Vores Produktionsoptimeringsplatform, der tilføjer sammenhænge mellem mislykkede testdata og produktmonteringsoplysninger. Ikke kun reducerer vi den tid og kræfter, der bruges på små fejl, men vi indsamler og transformerer data for at løse de store problemer for i sidste ende at gøre produkterne bedre. Kontakt os for at høre mere om, hvordan vi kan hjælpe dig med at forbedre din fejlanalyseproces.