R ile istatistiksel programlamaya giriş

İçindekiler
r istatistiksel bir programlama dilidir, ücretsiz ve açık kaynak kodludur. Esas olarak operasyonlar için kullanılır. veri madenciliği veya istatistik, tüm bunlar büyük miktarda verinin analizi için uygulamalar oluşturmak amacıyla.
komut satırı arayüzü r İlk başta biraz korkutucu olabilir, ancak dilin bilgi analizini paylaşma ve yeniden üretme gücü ve olanaklarını takdir ettikten sonra bu gölgelenir.
r Bugün var olan tüm ücretsiz platformlar için ücretsiz olarak indirilebilir, yükleme imkanımız var. pencereler, Linux ve hatta Mac.
Bu eğitimin amaçları doğrultusunda, sürümü şu amaçlar için kullanacağız: pencereler projenin resmi sayfasında aşağıdaki linkte bulabiliriz. İndirip kurduktan sonra, işlevsel kopyamıza sahip olacağız. r, eğer çalıştırırsak, ilk ekranımıza sahip olacağız. r hangi bu gibi görünmelidir:

r Verilerle hızlı ve etkili bir şekilde çalışmamızı sağlar, ancak varsayılan arayüzü bu görev için mükemmel değildir. Sorunlardan biri, her şeyin ayrı pencerelerde açılması ve çalışmayı zorlaştırması ve ayrıca komut satırı arayüzünün tüm işletim sistemlerinde aynı olmamasıdır.
Bu sorunu çözmek için birçok arayüz olmasına rağmen, bu derste kullanacağız RStudio tüm platformlar için mevcut, ancak sahip olması gerektiğini belirtmek önemlidir. r sürümünü almak için kurulumdan önce yüklenmiş pencereler aşağıdaki bağlantıya gidiyoruz ve ilgili sürümü indiriyoruz.
Kurulumdan sonra çalıştırıyoruz RStudio ve ana arayüzü görmeliyiz:

RStudio bize tüm pencerelerin organizasyonunu verir r tek bir panel içinde ve ayrıca bize bulunması zor olabilecek fonksiyonlara erişim sağlıyor, buna ek olarak başka ek avantajlardan da bahsedebiliriz:
  • işimizi ikiye bölelim Projeler bunların her birinin çalışma dizinine, geçmişine ve kaynak dosyalarına sahip olacağı yer.
  • ile entegrasyon GitHub.
  • Bir hikayeyi grafiksel olarak saklamanızı sağlar.
  • Grafikleri farklı format ve boyutlarda dışa aktarabilirsiniz.
  • Tablo tuşu ile kodu tamamlamamızı sağlar.
  • Belirli paketler sayesinde interaktif grafikler oluşturabilirsiniz.
Gördüğümüz gibi RStudio ile çalışmak için oldukça uygun bir yoldur rAncak piyasada başka çözümler de var, bunları araştırmak ve her bir kişinin ihtiyaçlarına daha iyi uyarlanıp uyarlanmadıklarını değerlendirmek herkese kalmış.
İle çalışmanın birkaç yolu vardır r ele alacağımız ilk şey nerede R konsoluBurada yapılan işleri depolayamasak da bazı fonksiyonları test etmek ve dile aşina olmaya başlamak oldukça faydalıdır.
Konsol ile çalışmak oldukça basit, bir komut giriyoruz ve ardından R bize bunun çıktısını veriyor, aşağıdaki gibi basit bir toplama işlemi deneyelim:
> 10 + 7

Biz iteriz Girmek ve otomatik olarak r Aşağıdaki satırda bize operasyonumuza cevap veriyor:

Görselde gördüğümüz gibi ilk satırda işlemimiz ile birlikte komut yer alıyor, belirtmekte fayda var. r satırı sonlandırmak için noktalı virgül veya başka bir sonlandırma operatörü kullanılmasını gerektirmez. Cevaptan önce ikinci satırda görebiliriz [1] bu nasıl bir yol olduğunu gösterir r aritmetik işlemleri yapar ve kullanır vektör, biri, vektörün ilk öğesinin dizini anlamına gelir, burada diğer birçok dilin dizinleri sıfırdan işlediğini vurgulayabiliriz, ancak r birinden yapar.
Daha önce de belirttiğimiz gibi, konsol oldukça kullanışlıdır ancak çalışmak için en iyisi değildir, çünkü esas olarak komutlarımızı saklama olanağına sahip olmadığı ve bir seferde yalnızca bir komut girme yeteneği olmadığı için benzer bir şey olur. piton, ama o zamandan beri endişelenmemeliyiz RStudio bize verir komut dosyası penceresi konsolumuzun üst kısmında bulunur, bulamazsak Dosya> Yeni Dosya> R Komut Dosyası veya basın Shift + Komut + N.
Temel olarak bir R betiği, uzantılı düz metindir. .R. Nasıl çalıştığını görmek için, yeni bir komut dosyası oluşturarak ve birkaç ek komut satırı ekleyerek önceki örnekteki aritmetik işlemimizi yeniden oluşturabiliriz, görelim:
 10 + 7 1:50 baskı ("Merhaba Dünya") 

A R komut dosyası adlı üst menüde sahip olduğumuz seçenek ile satır satır çalıştırabilirsiniz. Çalıştırmak ve bunun çıktısını konsolda göreceğiz, betiğimizin her satırı için yanıtı görelim:

İlk satırın bize daha önce elde ettiğimiz sonucu verdiğini nasıl görebiliriz, ikinci satır 1'den 50'ye kadar sayıların bir listesini oluşturur, burada parantez içindeki sayı o satırın ilk indeksidir ve son olarak klasik izlenimi ediniriz. Selam Dünya.
Dille nasıl çalışabileceğimizi gördükten sonra, çalışmak ve projelerimizi yürütmek için dilde nelere sahip olduğumuzu daha iyi anlamak için daha teorik kavramlara geçeceğiz.
Tüm programlama dillerinde olduğu gibi, değişkenler oluşturmak için en önemli unsurlardan biridir. r Türünü tanımlamadan sadece adını yazmamız yeterli. kullanıyoruz atama operatörü değişkene değer vermek için.
ÖnemliEşittir işaretli bir değişkenin değerini atayabiliriz, ancak bu kötü bir uygulamadır. r, doğru atamayı yapmak için operatörü kullanın <-.
Bir değişkene değer atamanın ve ardından yazdırmanın nasıl göründüğünü görelim:
 x <- 58 x 

Ayrıca concatenate fonksiyonu ile değişkenlerimize birkaç değer atayabiliriz:
y <- c (5, 2, 11, 28, 17)

Örneği çalıştırırsak, sağdaki panelde değerine nasıl sahip olduğumuzu göreceğiz. x ve atanan sayısal liste Y:

BÜYÜT

Ek olarak, çalışma alanından bir değişkeni ortadan kaldırmak için işlevi kullanmamız yeterlidir. rm, tüm çalışma alanını bile temizleyebiliriz, hadi bunu nasıl yaptığımıza bakalım:
 rm (x) rm (liste = ls ()) 

İlk satırla değişkeni, ikinci satırla tüm alanı ortadan kaldırırız.
Dilde, tarafından tanınan dört veri yapısına sahibiz. r:
karikatür vektörVektör, içinde bulunan tüm verilerin aynı türde, tamsayıda, karakterde vb. olması gereken tek boyutlu bir dizidir, ayrıca bunun temel veri nesnesi olduğuna dikkat etmek önemlidir. r.
Diziler ve MatrislerBir matris, verilerin aynı türde olması gereken bir vektöre benzer, ancak matrisin iki boyutu vardır ve bilgiler satırlar ve sütunlar halinde düzenlenir. Dizi, diziye benzer ancak ikiden fazla boyutu olabilir.
Veri çerçeveleriVeri çerçeveleri aynı uzunluktaki vektörlerin bir koleksiyonudur, matrise benzer, ancak bu tür yapının özelliği, vektörlerin isimlerinin bile olabileceği karışık veri türlerinde olabilmeleridir.
ListelerR'deki en genel yapı türü, bir liste herhangi bir sınıf, uzunluk veya yapıdaki öğelerin bir koleksiyonudur, hatta başka listelerimiz bile olabilir.
Daha ileri, r Bir yapı türünü diğerine dönüştürmemize izin veren birkaç işlevi var, bakalım:
as.vektör ()Bu işlev, matrisleri tek boyutlu vektörlere dönüştürmenize olanak tanır.
as.matris ()Veri yapılarını bir diziye dönüştürebilirsiniz.
as.data.frame ()Veri yapılarını veri çerçevelerine dönüştürebilirsiniz.
as.liste ()Veri yapılarını listelere dönüştürebilirsiniz.
güçlü yönlerinden biri r dilin işlevlerini genişletmemize izin veren paketler ekleyebilmenizdir. Diğer dillerde bu eklentiler kütüphanelerde gelir ancak R'de kütüphane tüm paketlerin depolandığı yerdir.
NS paketler nın-nin r iki farklı yerden gelebilir, bazıları r varsayılan olarak ancak etkin değillerdir ve diğerleri çevrimiçi depolarda bulunabilir.
Şu anda kurulu veya yüklü paketleri görmek için aşağıdaki işlevleri yürütebiliriz:
 kitaplık () arama () 

İşlev kütüphane () bize şu anda kurulu olan paketlerin bir listesini getiriyor, hadi bu satırı çalıştırdığımızda bize attıklarının bir kısmını görelim:

İşlev arama () Öte yandan şu anda yüklü olan paketleri konsol aracılığıyla bize gösteriyor, hangi paketleri yüklediğimizi aşağıdaki resimde görelim:

Ek olarak, paketleri kurmak için birkaç yoldan yapabiliriz, ilki üst menüdeki seçenek. Araçlar> Paketleri Yükle ve sonra dilin işlevleri aracılığıyla elde ederiz, ikincisi bizim komut dosyamızın bir parçası olabileceği için önerdiğimiz şeydir.
Kullandığımız bir paketi kurmak için kurulum.paketler, bundan sonra onu dahil etmeliyiz, kullanabiliriz kütüphane veya gerekmek Ancak bunun için, işlevlerin kapsamı ile karışıklığı önlemek için ikincisini kullanmak en iyisidir, hadi paketi nasıl kuracağımızı ve ekleyeceğimizi görelim. ggplot2:
 install.packages ("ggplot2") gerektirir ("ggplot2") 

Sonunda kullanabileceğimiz bir paketi silmek için kaldır.paketler, nasıl kullanıldığını görelim:
remove.packages ("ggplot2")

Bununla, nasıl çalışacağımıza dair bir fikrimiz olan bu öğreticiyi sonlandırıyoruz. r, değişkenler ve veri yapıları gibi noktaların netleştirilmesine ek olarak, bu güçlü ve etkili dilden tam olarak yararlanmak için bilmemiz gereken temel hususlar.Bu Eğitimi beğendiniz ve yardım ettiniz mi?Yazara olumlu puan vermek için bu düğmeye basarak yazarı ödüllendirebilirsiniz.

Arkadaşlarınızla sayfasını paylaşan sitenin gelişimine yardımcı olacak

wave wave wave wave wave