Visa en fördelning per maskin

Visa gemensam fördelning

Data för SPC och statistik, Nolato AB

Denna sida innehåller exempel och övningar på histogram, fördelningar, duglighet, etc.

Info, referenser, m.m...

Antal mätvärden per maskin:

Totalmedelvärde:

Medelavvikelse maskin 1:

Medelavvikelse maskin 2:

Medelavvikelse maskin 3:

Medelavvikelse plasttyp 11:

Medelavvikelse plasttyp 12:

Standardavvikelse:

Undre toleransgräns:

övre toleransgräns:

%Cpk (fig 1)...

%Cpk (fig 2)...

%Cpk (fig 3)...

Varje ruta innehåller parametervärden som används för att simulera data för analys (data skapas med makrot %Nolato). En ändring registreras direkt i rutorna till höger:


Antal mätvärden per maskin: I denna övning finns det tre maskiner (1, 2, 3) och antal simulerade mätvärden per maskin skrivs in i rutan.

Totalmedelvärde: Här anges totalmedelvärdet, ett medelvärde som är beräknat över samtliga mätvärden.

Medelavvikelse maskin 1: Om resultatet för maskin 1 är annorlunda (högre eller lägre) anges det här som medelavvikelse från totalmedelvärdet.

Medelavvikelse maskin 2: Se kommentar för 'Medelavvikelse maskin 1' ovan.

Medelavvikelse maskin 3: Eftersom totalmedelvärdet och medelavvikelserna för maskin 1 och 2 är bestämda, måste medelavvikelsen för maskin 3 beräknas.

Medelavvikelse plasttyp 11: I denna simulering finns det två plasttyper (11, 12) och 1/3 av alla data är från plasttyp 11. I rutan anges här medelavvikelse för plasttyp 11.

Medelavvikelse plasttyp 12: Eftersom totalmedelvärdet och medelavvikelserna för plastyp 11 är bestämda, måste medelavvikelsen för plasttyp 12 beräknas.

Standardavvikelse: I verkliga datamängder finns det en variation. Här simuleras detta med en slumpkomponent som adderas till mätvärdena ovan. (Slumpkomponenten är normalfördelad med medelvärde 0 och standardavvikelse enligt rutan.)

Undre toleransgräns: Här anges processens undre toleransgräns.

övre toleransgräns: Här anges processens övre toleransgräns.


Alla förändringar som görs i indatarutorna registreras på sidans 'kommandoruta'. För att skapa data i Minitab måste raden '%Nolato...' manuellt kopieras in i Minitab och aktiveras. Därefter kan analysen utföras.

Det finns tre knappar som visar övningar och texter (övningar i pdf-format kan skrivas ut och användas). De tre blå länkarna visar exempel på grafer som skapas av %Cpk-makrot i Minitab.

••••

Rutan visar tre fördelningar: blå är 'maskin 1', röd är 'maskin 2' och grön är 'maskin 3'. (Om det syns bara en eller två fördelningar innebär det att två eller fler maskiner har samma medelavvikelse.)
De tre vertikal linjerna motsvarar de två specifikationsgränserna (röda) samt processens medelvärde (grå).
Varje fördelning är en blandning av två plasttyper och om dessa har tillräckligt olika medelavvikelser, blir fördelningarna icke-symmetriska eller – om medelskillnaden är ännu större – tvåtoppiga.

Om markören förs över graffönstret visas en vertikal blå linje. Det ena värdet är linjens läge på X-axeln, det andra värdet är avståndet i procent till de två toleransgränserna. Klicka på den blå linjen för att lagra ett nytt totalmedelvärde för processen.

Med de två radioknapparna ovan fördelningarna är det möjligt att visa den totala fördelningen. Denna motsvarar det histogram som visas i Minitab då nedanstående kommandon har körts.

Observera 1/3 av alla mätningar gäller 'plasttyp 11' och 2/3 gäller 'plasttyp 12' (detta är inprogrammerat). De två plasttyperna är slumpmässigt fördelade över de tre maskinerna.



••••

'Kopiera/Klistra in' raderna i rutan nedan till 'Session window' i Minitab vid "MTB >"-prompten och tryck sedan på [Enter]-knappen på tangentbordet.

Första två raderna simulerar data för den angivna övningen. Övriga rader är förslag på analys och grafer.

Om värdet ändras i någon av indatarutorna visas ett antal radioknappar som skriver in motsvarande kommandon i rutan.



••••

De tre sifferuppgifterna visar det teoretiska medelvärdet och den teoretiska standardavvikelsen (sigma) samt 'Cpk'-värdet på det resultat som når kunden då processen har nuvarande prestanda.
När t.ex. skillnader mellan maskiner och skillnad mellan plastmaterial minskas, minskar också spridningen (sigma) och 'Cpk'-värdet ökar på resultat som når kunden.

Indatarutan 'Standardavvikelse:' är spridningen som åtstadkoms av andra variationskällor (dvs inte den variation som kommer av skillnader mellan maskiner eller plastmaterial).

Klicka på radioknappen "Visa gemensam fördelning" (över grafen) för att se fördelningen av resultat som når kunden. (Alla uppgifter kan jämföras med grafen 'fig 2' som skapas efter Minitab-körningen.)



••••

Two expressions for p

The two buttons (logit (p)) and (p) show the same model expressed differently. By rearranging and manipulating the p-version the logit-version is obtained. The main benefit is that the right side of the equal sign is now a linear expression.
Such expressions are generally much easier to analyze.
The drawback is that the parameters (the betas) are more difficult to interprete when evaluating the final model.

When a variable is omitted in the model, a red cross covers the variable. (Only in the logit-version.)

••••

Övning 1 – en första körning
Överför kommandona till Minitab-fönstret och tryck [Enter]. Grafen märkt 'fig 2' sammanfattar mätningarna. Totalmedelvärdet är ungefär 95.4 och standardavvikelsen är ungefär 1.8, Cpk är ungefär 0.39. Processen är alltså inte duglig enligt vanlig standard. Kör 'övning 2'.

Övning 2 – ingen skillnad mellan maskiner
I denna körning finns det ingen skillnad mellan maskinerna. I 'fig 2' visas att medelvärdet är fortfarande ungefär 95.4 och standardavvikelsen har minskat till ungefär 1.0 och Cpk har ökat till ungefär 0.74. Processen är fortfarande inte duglig. Kör 'övning 3'.

Övning 3 – ingen skillnad mellan plaster
I denna körning finns det heller ingen skillnad mellan plaster. I 'fig 2' visas att medelvärdet är fortfarande ungefär 95.4 och standardavvikelsen har minskat till ungefär 0.9 och Cpk har ökat till ungefär 0.78. Processen är fortfarande inte duglig. Kör 'övning 4'.

Övning 4 – förändring av medelvärde, standardavvikelse eller specifikationer
Denna körning utgår ifrån 'övning 3'. Gör en körning i Minitab och avgör i 'fig 2' hur man kan förändra medelvärde eller standardavvikelse eller processens specifikation så att processen får ett Cpk > 1.33. ändra sedan i rutorna och gör en ny körning. Det kan behövas flera körningar. (Tips: högerklicka triangeln och använd 'Crosshairs' för lättare att avgöra var den röda punkten ligger.)

Övning 5 – 'Probability plots' över maskiner
I denna övning finns det bara skillnader mellan maskinerna, ingen materialskillnad. En 'probability plot' visar tre parallella linjer, något förskjutna. Det betyder att de tre maskinerna har ungefär samma standardavvikelse (spridning) men olika medelvärden. Resultatet ges också som siffror i en tabell.

Övning 6 – Histogram över maskiner
I denna övning finns det bara skillnader mellan maskinerna, ingen materialskillnad. En graf visar tre histogram, något förskjutna. Resultatet ges också som siffror i en tabell.

Övning 7 – Ett matrisdiagram
I denna övning ritas ett s.k. matrisdiagram över data. Då man har många kolumner ger ett matrisdiagram en snabb överblick. Analysen underlättas om man använder s.k. 'brushing' (högerklicka diagrammet).

Övning 8 – Ingen skillnad mellan maskiner, minskad spridning
Ändra manuellt i rutorna så att alla avvikelser för maskin 1, 2 och 3 blir 0. Minska standardavvikelsen till 0.6. Notera att fördelningen passar ganska väl inom toleransgränserna men att den systematiska skillnaden mellan plastmaterialen framträder. Det finns alltså utrymme för ytterligare kvalitetsförbättringar genom att undersöka och eliminera skillnader mellan materialen.

Övning 9 – Ingen skillnad mellan maskiner eller material, Cp = Cpk = 1
Ändra manuellt i rutorna så att alla avvikelser för maskiner och plasttyper blir 0. Skapa en centrerad process och välj en standardavvikelse så att det blir exakt 6 standardavvikelser mellan undre och övre specifikationsgräns. Notera att fördelningen passar precis inom specifikationsgränserna. Kör %Cpk i Minitab och notera att Cp och Cpk blir nära 1.

Övning 10 – Ingen skillnad mellan maskiner eller material, Cp = Cpk = 1.33
Ändra manuellt i rutorna så att alla avvikelser för maskiner och plasttyper blir 0. Skapa en centrerad process och välj en standardavvikelse så att det blir exakt 8 standardavvikelser mellan undre och övre specifikationsgräns. Notera att fördelningen passar väl inom specifikationsgränserna. Kör %Cpk i Minitab och notera att Cp och Cpk blir nära 1.33.


••••

Länkar

Confidence interval for p (ENG)
The animation shows how a confience interval for p should be intepreted. Here p ('proportion', 'fault rate', etc) is the unknown parameter to be estimated from a dataset.

Several distributions with common μ and σ (ENG)
The animation shows several distributions with common μ and σ. By two slides these values can be changed and the corresponding functions visualised.

Simulering av kapabilitetsindex Cpk
Ett kapabilitetsindex är ett index som försöker sammanfatta förhållandet mellan utfallet från en process och dess specifikationer.

A mixture of distributions (ENG)
An animation that shows what happens when distributions are mixed.

Simulating a comparison of two proportions (ENG)
A simulation that shows some of the difficulties when comparing two proportions.

Animering av en enkel OC-kurva
Här animeras en enkel OC-kurva som beskriver vissa egenskaper hos ett enkel stickprovsförfarande.

Simulering av talet pi — Buffons nål
Här simuleras och animeras Buffons nål — ett klassiskt sätt att simulera det berömda talet pi.

Konfidensintervall
Här simuleras och animeras flera grundläggande egenskaper hos ett konfidensintervall.

Ett antal fördelningar
Initialt visas en Weibullfördelning men ett antal kontinuerliga och diskreta fördelningar kan visas via en länk. För varje fördelning kan parametrarna ändras steglöst så att fördelningarnas form och läge uppdateras.

Avverkning av felrapporter
Simuleringen visar hur antal felrapporter minskar då antal 'ut' överstiger antal 'ut' och minskningen sker ungefär som en rät linje. Variationen vid RTL ("Ready To Launch") påverkas kraftigt då 'utintensiteten' förändras.

Kvalitetsbristkostnader
Simulering av en enkel process (utan alternativa flöden) där en enhet kan ha upp till fem olika fel. Det finns tre teststationer där felen kan upptäckas eller passera oupptäckta (den sista teststationen är kunden).

En Markovkedja
Simulering av en enkel s.k. Markovkedja. En sådan beskrivs ofta som en process med flera steg och där ett 'ärende' kan hoppa omkring med kanske inget eller flera slut. En hiss kan ju gå från olika våningar men kommer aldrig fram medan ett bankärende eller felrapport kommer att avslutas förr eller senare.

En Quincunx
En s.k. Quincunx är en enkel apparat där man låter kulor e.d. falla ned mot någon typ av stopp och på så sätt visa hur summan av en mängd små händelser leder till ett normalfördelat utfall.


Minitab-makron

%2000   Makrot plottar 2000 punkter (som tidigare simulerats) och diagrammet visar en kanske oväntad form men helt i linje med statistisk teori. Kräver en viss kunskap om binomialfördelningen.

%Birthday   Makrot simulerar och illustrerar det klassiska födelsedagsproblemet "Hur stor grupp behövs för att hitta minst två personer med samma födelsedag?".

%CLT   Makrot illustrerar den s.k. centrala gränsvärdessatsen (CLT). När ett antal värden summeras (t.ex. ett medelvärde) tenderar utfallet att bli mer normalfördelat då antal termer ökar. Se också %Die.

%CreDist   Makrot skapar en teoretisk diskret sannolikhetsfördelning baserad på användarens indata. Dessutom simuleras data från denna fördelningen.

%Die   En vanlig tärning används ofta för att illustrera statistisk teori. Här visas bl.a. hur fördelningen av en summa av värden snabbt närmar sig en normalfördelning. Se också %CLT.

%DistA   Makrot ger teoretisk info och simulerar 12 olika sannolikhetsfördelningar som kan användas i praktiskt arbete. ('Cachy' är matematiskt extremt avvikande och bör studeras för just dessa egenskaper. Se t.ex. [3])

%DrawPin   Makrot simulerar kastserier där varje resultat har två värden. Den observerade kvoten närmar sig det sanna värdet samtidigt som utfallet (summan) blir mer symmetriskt. Se också %CLT och %Die.

%DxDy   Inom elektronitillverkning är det viktigt att anpassa olika masker mot varandra. Hur görs detta på bästa sätt om varje mask har måttoriktigheter? Makrot gör en matematisk optimering så att de kvarvarande felen blir så små som möjligt (dvs felens varians i X- och Y-led minimeras).

%Hdist   Makrot simulerar det kortaste avståndet mellan två punkter i planet. Exemplet kommer från elektroniktillverkning där punkter för t.ex. komponenter och elektriska ledare skall sammanfalla utan alltför stora avvikelser. Se t.ex. [5], [6], [7].

%Hist   Makrot gör en genomgång av och diskussion om begreppen histogram och sannolikhetsdiagram ('probability plot'). Användaren kan ändra parametervärden, antal, data, etc.

%LinC   Linjärkombinationer uppstår då man sätter ihop detaljer, lägger ihop tider, beräknar medelvärden, etc, alltså då man adderar eller subtraherar mätvärden till en summa. Makrot illustrerar detta med en axeltapp som skall passa i en lagring. Se t.ex. [A good example...] och [Combination of...].

%Merror   Mätfel är alltid ett aktuellt ämne då man studerar data. Vad är sannolikheten att ett uppmätt resultat, utanför givna specifikationer, verkligen är fel? Vad är sannolikheten att ett mätresultat, inom specifikationerna, verkligen är rätt? Naturligtvis kan man inte skilja mellan mätvärdet och det sanna värdet, man kan dock göra upprepade mätningar på t.ex. kända likare och sålunda få ett grepp om felet. Observera att även om mätvariabeln är kontinuerlig så blir ju resultatet av typ 'OK' respektive 'ej OK'.

%MinMax   Ibland är man intresserad av extremvärden: 'hur stark är den svagaste länken i en kedja?' Värden som 'min', 'median', 'max' kallas på engelska för 'Order statistics'. Ett annat exempel: '5 % får understiga 15 mH' är en specifikation om 'order statistics' nämligen 5-percentilen. 'Order statistics' är något extra komplicerat men är värt att studera och känna till. Se t.ex. [Order statistics.doc] och [Fastest scorer.doc].

%Mix   En mixture är en blandning av mätvärden och skall inte förväxlas med en kombination av variabler. En blandning av data är naturligtvis oerhört vanligt. Makrot ger teoretisk info och simulerar hur blandningar kan uppstå. Se t.ex. [57])

%OC   'OC' är en förkortning för 'Operating Characteristic' och används oftast inom stickprovsteori (som ju också är 'beslutsteori', dvs man fattar beslut om t.ex. partier av produkter och där det finns en risk att man fattar fel beslut p.gr.a resultatet i stickprovet.)
Makrot ritar tre olika grafer som är vanliga då man diskuterar OC-kurvor. Observera att makrot bara visar teoretiska resonemang, det finns inga simulerade data eller andra data. 'p' på X-axeln är processens felkvot, inte observerade data.

%PoAcc   Makrot diskuterar Poissondata och ritar en graf med tre olika processer med olika parametervärden. (Dessa kan ändras inför en ny simulering, se detaljer i datafönstret.) I graferna ritas resultatet som ackumulerande, dvs för varje ny händelse så hoppar kurvan ett steg uppåt på Y-axeln. Detta kallas ibland för en 'pure birth process' dvs det finns inga 'deaths'. De tre färgade punkterna längst till höger anger förväntat resultat och graferna kommer att sluta som en slumpmässig variation runt dessa punkter i enlighet med Poisson-fördelningens egenskaper.

%PoisSim   Makrot diskuterar en jämförelse mellan 'medelvärde' och 'median' i en Poissonfördelning. (Upprinnelsen är en IT-avdelning på ett större företag som ville börja redovisa 'median för antal störningar per månad' i stället för medelvärdet.) Det visar sig att medianen är långt mer okänslig mot förändringar i processen, detta ansågs vara bra ty det oroade inte kunderna! En utförlig diskussion: [27])

%Reg   Regressionsanalys är en oerhört viktig analysform. Idén är att söka ett samband mellan ett mätresultat och en eller flera förklarande variabler. Grunderna presenteras i många böcker om statistisk analys och makrot understryker de viktigaste punkterna samt ger möjlighet att simulera samband för bättre förståelse.

%Rounding   Den som använder 'normalitetstest' på data stöter ibland på 'Anderson-Darling'-test. Eftersom riktiga data oftast är begränsade till en, två eller tre decimaler, brukar testet förkasta hypotesen om 'normalitet'. Makrot simulerar data och diskuterar hur testet reagerar på olika avrundningar av data. Se också [79])

%ScrapCost   Antag att vi producerar elektronikkomponenter, t.ex. mönsterkort. Vi börjar då med ett råmaterial, ett ämne, som vi sedan förädlar genom att borra hål för komponenter, etsa fram mönster, skyddslacka ytan, konturbearbeta. Varje sådan operation är inte helt felfri så i slutändan har man antagligen färre produkter än antal ämnen vid start.
Om vi har färre produkter än vi har lovat kunden uppstår kostnader av typ omstartskostnader, förseningskostnader, etc. Om vi i stället har fler produkter tvingas vi kassera eller ge bort dem utan ersättning. Hur skall man eller kan man resonera om det 'överantal' som man bör starta med? Makrot beräknar förväntad kostnad. Se också dokument i 'Statistikhörnan'.

%SimQ   Många praktiska situationer kan beskrivas som köer – personer till betjäningsställen, ansökningar om bygglov, felrapporter i IT-utveckling, testning och omtestning av produkter i en produktionslina etc. Makrot simulerar en sådan enkel kö och ritar ett antal grafer. Köteori bygger ofta på s.k. Markovkedjor eller Markovprocesser och dessa är rikt dokumenterade på nätet och i litteraturen och väl värda uppmärksamhet.

%SimUB   Praktiska situationer blir ibland extra komplicerade och då kan simulering vara ett sätt att få bra svar. Makrot beskriver ett fall där en elektrisk krets består av två resistanser. En matematisk formel används för att beräkna obalansen (UB) i kretsen. I praktiken finns det en viss variation mellan komponenterna innan de löds ihop till en krets och en central fråga är hur denna variation påverkar slutresultatet.
Makrot simulerar data med olika standardavvikelse på resistansen och redovisar sedan vilken andel kretsar som har ett UB-värde som ligger utanför specifikation. Ju mindre variation hos komponenterna desto bättre (och dyrare!) krets.

%Taxi   Makrot diskurerar hur man kan skatta det högsta talet (N) i en serie typ 1, 2, 3, ...N och där man har ett stickprov från serien. Makrot redovisar två skattningsmetoder med förbluffande olika precision.

%Timing   Makrot är populärt ty det simulerar mer och mer data i ett antal kolumner och mäter tiden och ger sålunde info om prestanda hos datorn (brukar ge upphov till jämförelser och diskussioner). Resultatet presenteras som en regressionsanalys (se %Reg) med två förklarande variabler.

%TwoNo   Makrot simulerar en relativt enkel situation med två mått på samma enhet men där det är viktigt att rätt formulera frågan som skall besvaras. Se t.ex. [2])

%W   Makrot ritar och simulerar fyra olika Weibullfördelningar givet parametervärden som anges i datafönstret.

%XbarS   Makrot sammanfattar ett antal punkter om medelvärde och standardavvikelse samt simulerar värden som presenteras i några grafer. Datafönstret innehåller ett antal övningar.

Några dokument

Några erfarenheter
Några erfarenheter med att arbeta med data.

Ett antal dokument
Mer än 25 olika dokument om varierande område inom statistik och statistisk analys. Se t.ex. "What is sigma?" som har en noggrann genom av vad sigma är, hur sigma skall tolkas, hur sigma kan beräknas, etc.



••••