Edited by Ali R+ SARAL from Onlinecourses.science.psu.edu STAT 501
1.1
- What is Simple
Linear Regression?
Basit Doğrusal İlişki nedir?
Simple
linear regression
is a statistical method that allows us to summarize and study relationships
between two continuous (quantitative) variables:
Basit doğrusal ilişki iki sürekli(sayısal) değişken arasındaki ilişkileri
özetlememizi ve incelememizi mümkün kılan istatistiksel bir yöntemdir:
§
One variable, denoted x, is regarded
as the predictor, explanatory, or independent variable.
Bir değişken, x ile gösterilip, öngörücü, açıklayıcı veya bağımsız
değişken olarak görülür.
§
The other variable, denoted y, is
regarded as the response, outcome, or dependent variable.
Diğer değişken, y ile gösterilip yanıt, sonuç, bağımlı
değişken olarak görülür.
...
Simple linear regression gets its adjective
"simple," because it concerns the study of only one predictor
variable.
Basit doğrusal ilişki ‘basit’ sıfatını yalnız bir değişkenin incelenmesi
ile ilgili olduğu için alır.
...
Types
of relationships
İlişki Tipleri
Before
proceeding, we must clarify what types of relationships we won't study in this
course, namely, deterministic (or functional) relationships.
Here is an example of a deterministic relationship.
Daha fazla ilerlemeden, bu kursta hangi tip ilişkileri ele almayacağımızı
belirtelim, belirleyici(deterministic) ya da fonksiyonel(functional)
ilişkiler. İşte bir belirleyici ilişki
örneği.
Note
that the observed (x, y) data points fall directly on a line. As
you may remember, the relationship between degrees Fahrenheit and degrees
Celsius is known to be:
Fahr =95Cels+32Fahr =95Cels+32
Gözlenen(x,y)
veri noktaları doğrudan bir doğru üzerine düşmekte. Fahrenheit ve Celcius
arasındaki ilişki hatırlayacağınız gibi:
Fahr =95Cels+32Fahr =95Cels+32
That
is, if you know the temperature in degrees Celsius, you can use this equation
to determine the temperature in degrees Fahrenheit exactly.
Yani, eğer Celcius cinsinden dereceyi biliyorsanız, bu formulü kullanarak
Fahrenheit cinsinden sıcaklığı tam olarak bulabilirsiniz.
§
...
For
each of these deterministic relationships, the equation exactly
describes the relationship between the two variables. ...
Herbir belirleyici ilişki için, eşitlik iki değişken arasındaki ilişkiyi
tam olarak tarif eder.
Instead,
we are interested in statistical relationships, in which the
relationship between the variables is not perfect.
Bunun yerine, biz değişkenler arasındaki ilişkinin ideal olmadığı,
istatistiksel ilişki ile ilgileniyoruz.
Here
is an example of a statistical relationship. The response variable y is
the mortality due to skin cancer, the predictor variable x is the
latitude (degrees North) at the center of each of 49 states in the U.S ...
İşte istatistiksel ilişkiye bir örnek. y değişkeni deri kanserine bağlı
ölüm sayılarını x değişkeni ABD’deki 49
devletin tam ortalrından geçen boylamları belirtir.
You
might anticipate that if you lived in the higher latitudes of the northern
U.S., the less exposed you'd be to the harmful rays of the sun, and therefore,
the less risk you'd have of death due to skin cancer.
Eğer ABD’nin daha kuzey bölgelerinde yaşıyorsanız, tehlikeli güneş
ışınlarına daha çok maruz kalacağınızı, böylece deri kanserinden ölümlerin daha
fazla olacağını öngörebilirsiniz.
The
scatter plot supports such a hypothesis. There appears to be a negative linear
relationship between latitude and mortality due to skin cancer, but the
relationship is not perfect.
Dağınık noktalama şekli bu hipotezi desteklemektedir. Deri kanseri ile ölümlerde boylam ile karşıt
bir doğrusal ilişki belirmektedir.
Indeed, the plot exhibits some "trend,"
but it also exhibits some "scatter." Therefore, it is a
statistical relationship, not a deterministic one.
Gerçekten noktalama şekli bir ‘eğilimi’ göstermekte fakat aynı zamanda bir
“dağılmayı”da göstermektedir. Bu yüzden,
bu istatistiksel bir ilişkidir, belirleyici değildir.