Meine noch nicht ganz fertigen Lösungen sind jetzt hier online: http://www.weinchen.de/biostat/
Schreibt doch hier, wenn ihr Fragen zu einzelnen Aufgaben habt!
Übungsserie 1
Übungsserie 2
Aufgabe 10
Ich hab keinen Schimmer, ihr? - Sebastian
Einwohnerzahl - ich hab gedacht, dass es vielleicht an den Öffis liegt. Großstädte haben ja meistens U-Bahnen, Busse und dergleichen. Das wirkt sich ja positiv auf die Schadstoffbilanz aus, zumindest im Verhältnis zur Einwohnerzahl.... wenn nicht jeder mit seinem Privat-PKW fährt. -Henrike
Hm, interessanter Gedanke. Aber dann sollte der Regressionskoeffizient doch trotzdem nicht negativ sein, oder? Vielleicht ist gibt es aber in größeren Städten weniger Schwerindustrie und mehr Handel und Dienstleistungen? - Sebastian
oder es gibt mehr grünanlagen wegen der kinderfreundlichkeit, etc. weniger schwerindustrie - ja. und: bei gleicher anzahl von großen betrieben gibt es in großen städten mehr menschen auf mehr fläche, dh weniger so2 pro fläche. in kleinen städten konzentriert sich die gleiche industriemenge auf kleinere flächen - daher wird ein höherer so2-gehalt gemessen. -Henrike
Übungsserie 3
Aufgabe 2 b
Hat jemand einen Tip? - Sebastian
Hm, ich hab was von externen Faktoren geschrieben. Vielleicht möchte er auch einfach nur hören, dass es immer eine Variabilität gibt in Experimenten mit lebenden Objekten. Hat er ja mehrmals erwähnt. -Henrike
Ich mutmaße, dass in dem anderen Experiment noch zusätzlich das Geschlecht erfasst worden sein könnte...- Sebastian
oh, das klingt sehr gut! oder das alter der hamster.. -Henrike
Übungsserie 4
Bei der letzten Aufgabe sind alle Variablen im Modell geblieben. Soll das so sein? Kommt mir komisch vor. -Henrike
Kommt mir auch komisch vor. Ich bekomme ausserdem noch eine Warnung von R:
- Warnmeldungen : 1: In glm . fit (X , y , wt , offset = offset , family = object $ family , ...
- :
- fitted probabilities numerically 0 or 1 occurred
Wenn man die Variable phosphor weglässt, kommt die Fehlermeldung nicht und step() selektiert n, kalium und corg. Aber phosphor weglassen geht nicht wirklich ;-). Ich hab auch als weitere Variable corg^2 genommen und die ist immerhin aussortiert worden - step() scheint also prinzipiell zu funktionieren. Ich hab Cornelius mal ne Mail dazu geschrieben. - Sebastian
So, hier meine Korrespondenz mit Cornelius:
Hallo Sebastian, Die Warnung tritt grob gesagt auf, wenn die Kurve recht steil wird. Lass den Ausreisser bei der Analyse ruhig drin, es sei denn es gibt eine biologische Begründung, ihn rauszunehmen. Da hast du als Biologe mehr Ahnung als ich. Viele Grüße Cornelius ----- Original Message ----- From: Sebastian Hanß [mailto:sebastian.hanss@uni-jena.de mailto:sebastian.hanss@uni-jena.de] Sent: Monday, August 18, 2008 2:21 PM To: Cornelius Middelhoff Subject: Re: biostatistische Übungen - Frage zu Übungsaufgabe Hallo Cornelius, danke fuer deine Mail! Ich hab mir die Sachen gerade durchgeschaut und meine Ideen dazu hier aufgeschrieben. Cornelius Middelhoff schrieb: > > Diese Meldung kann (aber muss nicht) auf ein Problem in den Daten hindeuten. > > siehe PDF-Anhang. > > hier ein simples Beispiel, wo das "so" auftritt > > > > x <- 1:20 > > y <- rep(c(0,1),each=10) > > plot(x,y) > > #Hier ist ein scharfe Grenze: über 10 ist y immer 1, darunter immer 0 > > test <- glm(y~x,family="binomial") > > summary(test) > > relativ gut beschreibt es auch > > http://finzi.psych.upenn.edu/R/Rhelp02a/archive/124550.html ok, ich hab es jetzt so verstanden: Die Warnung tritt auf, wenn eine lineare Seperation der Daten moeglich waere und (damit?) eine perfekte Anpassung des Modells moeglich ist. R warnt vermutlich, weil man in diesem Fall nachpruefen sollte, ob dass theoretisch ueberhaupt moeglich ist. Kommt das so ungefaehr hin? > > Der AIC von 228 spielt in dem Zshg keine Rolle, der absolute Wert ist egal, > > es geht nur darum, die AICs verschiedener Modelle zu vergleichen. ah, gut. > > Probier mal ein glm mit y~phospor , d.h. ohne die anderen Variablen > > > > Du siehst immer noch die Fehlermeldung genau. (glm5 <- glm(brimed~phosphor, family="binomial")) > > Jetzt mach mal einen Plot phoshor gegen brimed plot(phosphor,brimed) > > Woran könnte das jetzt liegen? Versuche deine Vermutung zu verifizieren! Hm, es gibt da einen outliner (Punkt 188), wenn ich den weglasse: glm5 <- glm(brimed[-188]~phosphor[-188], family="binomial") plot(phosphor[-188],brimed[-188]) gibts keine Warnungen mehr. Andererseits sollte ich den Punkt nicht einfach weglassen, oder? Dass bei einer extremen Phosphatbelastung nie etwas waechst klingt sinnvoll. Also die Warnung zur Kenntnis nehmen und weitermachen? Bei der Variablenauswahl aendert sich nichts, so oder so werden alle Variablen fuer das Modell selektiert, auch das AIC bleibt gleich: glm0<-glm(brimed~1,family="binomial") glm1<-step(glm0,scope=~corg+n+phosphor+kalium+ph) . vs. glm0a<-glm(brimed[-188]~1,family="binomial") glm1a<-step(glm0a,scope=~corg[-188]+n[-188]+phosphor[-188]+kalium[-188]+ph[- 188])
- Sebastian
Übungsserie 5
Aufgabe 1
oeh, ich hab da einfach ANOVAs gemacht - da lieg ich vermutlich falsch, oder? Ich kann auch keine Zusammenhänge nachweisen... - Sebastian
Aufgabe 2
Ich komm gar nicht klar mit dem "lesen" der Ergebnisse der letzten Aufabe. Nach dem glm() hab ich nur Kombinationen von kids, male, Kontrolle und tot - wie komm ich da auf Rückschlüsse über geheilt und Behandlung? -Henrike
Geht mir genauso... Ich hab halt geschrieben, dass keine Männchen behandelt werden sollten, aber aus meinen Ergebnissen konnte ich das nicht wirklich herauslesen. - Sebastian
