आर में डेटा टाइप्स और वेरिएबल्स (Data Types and Variables in R)

आर में डेटा टाइप्स और वेरिएबल्स (Data Types and Variables in R)

R प्रोग्रामिंग में डेटा टाइप्स और वेरिएबल्स का सही ढंग से समझना बेहद महत्वपूर्ण है। विभिन्न डेटा टाइप्स, जैसे कि नंबर, स्ट्रिंग्स, और लॉजिकल्स, हमें यह तय करने में मदद करते हैं कि डेटा कैसे संग्रहीत और उपयोग किया जाएगा। वेरिएबल्स का उपयोग डेटा को असाइन और मैनेज करने के लिए किया जाता है। इस अध्याय में आप विभिन्न प्रकार के डेटा टाइप्स और वेरिएबल्स के साथ काम करना सीखेंगे, और अंत तक आप आर में डेटा का प्रभावी ढंग से उपयोग करने में सक्षम होंगे।

डेटा टाइप्स का परिचय (Introduction to Data Types)

आर प्रोग्रामिंग में डेटा टाइप्स यह निर्धारित करते हैं कि किसी वेरिएबल में कौन-सी प्रकार की जानकारी संग्रहीत की जा सकती है। डेटा टाइप्स को सही ढंग से समझना प्रोग्रामिंग और डेटा विश्लेषण के लिए अत्यधिक महत्वपूर्ण है, क्योंकि हर प्रकार के डेटा के साथ अलग-अलग ऑपरेशन्स किए जा सकते हैं। आर में मुख्य रूप से पांच प्रकार के डेटा टाइप्स होते हैं:

  1. न्यूमेरिक (Numeric) – संख्यात्मक डेटा जैसे 2, 3.14 आदि।
  2. इंटीजर (Integer) – पूर्णांक संख्या, जैसे 1, 2, 3 आदि।
  3. कैरेक्टर (Character) – टेक्स्ट डेटा या स्ट्रिंग्स, जैसे “Hello”, “R programming” आदि।
  4. लॉजिकल (Logical) – बूलियन वैल्यूज़, जो TRUE या FALSE हो सकती हैं।
  5. कॉम्प्लेक्स (Complex) – जटिल संख्या जैसे 2+3i।

इन डेटा टाइप्स को पहचानना और उनका उपयोग समझना, आर में डेटा को सही तरीके से प्रबंधित करने के लिए महत्वपूर्ण है। प्रत्येक डेटा टाइप में विभिन्न गणितीय और लॉजिकल ऑपरेशन्स किए जा सकते हैं, और आर प्रोग्रामिंग में सही डेटा टाइप का चयन आपकी स्क्रिप्ट को अधिक प्रभावी बनाता है।

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# विभिन्न डेटा टाइप्स का उदाहरण
# Numeric डेटा टाइप
num <- 3.14
print(num) # 3.14
# Integer डेटा टाइप
int <- 5L
print(int) # 5
# Character डेटा टाइप
char <- "R programming"
print(char) # "R programming"
# Logical डेटा टाइप
log <- TRUE
print(log) # TRUE
# Complex डेटा टाइप
comp <- 2 + 3i
print(comp) # 2+3i
# विभिन्न डेटा टाइप्स का उदाहरण # Numeric डेटा टाइप num <- 3.14 print(num) # 3.14 # Integer डेटा टाइप int <- 5L print(int) # 5 # Character डेटा टाइप char <- "R programming" print(char) # "R programming" # Logical डेटा टाइप log <- TRUE print(log) # TRUE # Complex डेटा टाइप comp <- 2 + 3i print(comp) # 2+3i
# विभिन्न डेटा टाइप्स का उदाहरण

# Numeric डेटा टाइप
num <- 3.14  
print(num)  # 3.14

# Integer डेटा टाइप
int <- 5L  
print(int)  # 5

# Character डेटा टाइप
char <- "R programming"
print(char)  # "R programming"

# Logical डेटा टाइप
log <- TRUE  
print(log)  # TRUE

# Complex डेटा टाइप
comp <- 2 + 3i  
print(comp)  # 2+3i

Notes:

  1. आर में न्यूमेरिक और इंटीजर डेटा टाइप्स में अंतर यह है कि इंटीजर डेटा के लिए एक पूर्णांक के साथ L का उपयोग करना पड़ता है।
  2. कैरेक्टर डेटा को हमेशा डबल कोट्स (” “) में लिखा जाता है।
  3. आप class() फंक्शन का उपयोग करके किसी वेरिएबल के डेटा टाइप की जांच कर सकते हैं।

आर में वेरिएबल्स क्या हैं? (What are Variables in R?)

आर प्रोग्रामिंग में, वेरिएबल्स का उपयोग डेटा को संग्रहीत और प्रबंधित करने के लिए किया जाता है। वेरिएबल्स असाइनमेंट ऑपरेटर (<- या =) का उपयोग करके किसी भी प्रकार के डेटा को संग्रहीत कर सकते हैं, जैसे कि संख्या, टेक्स्ट, लॉजिकल वैल्यूज़, या कॉम्प्लेक्स संख्या। वेरिएबल्स का नाम एक तरह से डेटा को संदर्भित करता है, ताकि हम बाद में उसी नाम से उस डेटा को एक्सेस कर सकें।

वेरिएबल्स का सही ढंग से उपयोग कोड की पठनीयता और रखरखाव को आसान बनाता है। आर में, आप एक ही वेरिएबल में किसी भी डेटा टाइप को स्टोर कर सकते हैं, लेकिन यह ध्यान रखना ज़रूरी है कि वेरिएबल्स केस-सेंसिटिव होते हैं, यानी Var और var अलग-अलग वेरिएबल्स होंगे।

इसके अलावा, वेरिएबल्स को नाम देने में कुछ नियम होते हैं:

  1. वेरिएबल्स का नाम हमेशा एक अक्षर से शुरू होना चाहिए।
  2. नाम में संख्या या अंडरस्कोर _ का उपयोग किया जा सकता है, लेकिन स्पेस और अन्य विशेष वर्ण मान्य नहीं होते।
  3. वेरिएबल्स को केस-सेंसिटिव माना जाता है।
Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# वेरिएबल असाइनमेंट का उदाहरण
# Numeric डेटा टाइप वेरिएबल
a <- 10
print(a) # 10
# Character डेटा टाइप वेरिएबल
b <- "Hello, R!"
print(b) # "Hello, R!"
# Logical डेटा टाइप वेरिएबल
c <- FALSE
print(c) # FALSE
# वेरिएबल असाइनमेंट का उदाहरण # Numeric डेटा टाइप वेरिएबल a <- 10 print(a) # 10 # Character डेटा टाइप वेरिएबल b <- "Hello, R!" print(b) # "Hello, R!" # Logical डेटा टाइप वेरिएबल c <- FALSE print(c) # FALSE
# वेरिएबल असाइनमेंट का उदाहरण

# Numeric डेटा टाइप वेरिएबल
a <- 10
print(a)  # 10

# Character डेटा टाइप वेरिएबल
b <- "Hello, R!"
print(b)  # "Hello, R!"

# Logical डेटा टाइप वेरिएबल
c <- FALSE
print(c)  # FALSE

इस कोड में, हमने तीन प्रकार के वेरिएबल्स असाइन किए हैं:

  • a वेरिएबल में न्यूमेरिक वैल्यू 10 संग्रहीत है।
  • b वेरिएबल में एक कैरेक्टर स्ट्रिंग “Hello, R!” संग्रहीत है।
  • c वेरिएबल में लॉजिकल वैल्यू FALSE स्टोर की गई है।

हर वेरिएबल को print() फंक्शन का उपयोग करके आउटपुट किया गया है, जो वेरिएबल्स की वैल्यू को कंसोल में दिखाता है। आर में वेरिएबल्स को किसी भी समय बदला या अपडेट किया जा सकता है, और वे किसी भी प्रकार के डेटा को स्टोर कर सकते हैं।

Notes:

  1. वेरिएबल्स को = या <- दोनों तरीकों से असाइन किया जा सकता है, लेकिन <- आर में अधिक प्रचलित है।
  2. आप ls() फंक्शन का उपयोग करके अपने वर्कस्पेस में सभी मौजूदा वेरिएबल्स की सूची प्राप्त कर सकते हैं।
  3. वेरिएबल का नाम चुनते समय हमेशा एक वर्णनात्मक नाम चुनें, ताकि यह आपके कोड को अधिक पठनीय बना सके।

आर में मुख्य डेटा टाइप्स (Key Data Types in R)

Theoretical Content:
आर प्रोग्रामिंग में डेटा को विभिन्न प्रकारों में वर्गीकृत किया जाता है, और प्रत्येक प्रकार का अपना विशेष उपयोग होता है। डेटा टाइप्स की पहचान करना और उनका सही उपयोग आर के अंदर डेटा को मैनेज करने के लिए महत्वपूर्ण है। आर में पांच प्रमुख डेटा टाइप्स होते हैं:

  1. न्यूमेरिक (Numeric): यह डेटा टाइप दशमलव संख्याओं को संग्रहीत करता है। उदाहरण: 2.5, 100.45 आदि। यह गणितीय गणनाओं के लिए उपयोग किया जाता है।
  2. इंटीजर (Integer): यह प्रकार केवल पूर्णांक संख्याओं को संग्रहीत करता है। एक पूर्णांक को दर्शाने के लिए संख्याओं के बाद L जोड़ा जाता है, जैसे: 5L, 10L
  3. कैरेक्टर (Character): यह डेटा टाइप स्ट्रिंग्स या टेक्स्ट को संग्रहीत करता है, जो डबल कोट्स (” “) में लिखा जाता है। उदाहरण: "Hello", "R Programming"
  4. लॉजिकल (Logical): यह डेटा टाइप बूलियन वैल्यूज़ को संग्रहीत करता है, जो केवल दो मानों में होता है: TRUE या FALSE। यह डेटा की सत्यता को दर्शाने के लिए उपयोग किया जाता है।
  5. कॉम्प्लेक्स (Complex): यह प्रकार जटिल संख्या (Complex numbers) को संग्रहीत करता है, जिसमें वास्तविक और काल्पनिक दोनों भाग होते हैं। उदाहरण: 2+3i, जहां i काल्पनिक संख्या है।

प्रत्येक डेटा टाइप का आर में विशेष महत्व है, और उनकी सही पहचान डेटा प्रबंधन को अधिक कुशल बनाती है। आर प्रोग्रामिंग में सही डेटा टाइप का चयन आपके प्रोग्राम की गति और सटीकता को बढ़ाता है।

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# आर में मुख्य डेटा टाइप्स का उदाहरण
# Numeric डेटा टाइप
num <- 45.6
print(num) # 45.6
# Integer डेटा टाइप
int <- 10L
print(int) # 10
# Character डेटा टाइप
char <- "आर प्रोग्रामिंग"
print(char) # "आर प्रोग्रामिंग"
# Logical डेटा टाइप
log <- TRUE
print(log) # TRUE
# Complex डेटा टाइप
comp <- 5 + 2i
print(comp) # 5+2i
# आर में मुख्य डेटा टाइप्स का उदाहरण # Numeric डेटा टाइप num <- 45.6 print(num) # 45.6 # Integer डेटा टाइप int <- 10L print(int) # 10 # Character डेटा टाइप char <- "आर प्रोग्रामिंग" print(char) # "आर प्रोग्रामिंग" # Logical डेटा टाइप log <- TRUE print(log) # TRUE # Complex डेटा टाइप comp <- 5 + 2i print(comp) # 5+2i
# आर में मुख्य डेटा टाइप्स का उदाहरण

# Numeric डेटा टाइप
num <- 45.6
print(num)  # 45.6

# Integer डेटा टाइप
int <- 10L
print(int)  # 10

# Character डेटा टाइप
char <- "आर प्रोग्रामिंग"
print(char)  # "आर प्रोग्रामिंग"

# Logical डेटा टाइप
log <- TRUE
print(log)  # TRUE

# Complex डेटा टाइप
comp <- 5 + 2i
print(comp)  # 5+2i

इस कोड में, विभिन्न डेटा टाइप्स को वेरिएबल्स में संग्रहीत किया गया है:

  • num: एक न्यूमेरिक वेरिएबल है, जिसमें दशमलव संख्या (45.6) संग्रहीत की गई है।
  • int: एक इंटीजर वेरिएबल है, जिसमें पूर्णांक संख्या (10) को L का उपयोग करके संग्रहीत किया गया है।
  • char: एक कैरेक्टर वेरिएबल है, जिसमें स्ट्रिंग "आर प्रोग्रामिंग" स्टोर की गई है।
  • log: एक लॉजिकल वेरिएबल है, जिसमें वैल्यू TRUE स्टोर की गई है।
  • comp: एक कॉम्प्लेक्स वेरिएबल है, जिसमें जटिल संख्या 5+2i संग्रहीत की गई है।

यह उदाहरण दिखाता है कि कैसे आर में विभिन्न प्रकार के डेटा टाइप्स को वेरिएबल्स में असाइन और प्रिंट किया जा सकता है।

Notes:

  1. आप class() फंक्शन का उपयोग करके किसी वेरिएबल के डेटा टाइप की जांच कर सकते हैं।
  2. आर में न्यूमेरिक और इंटीजर के बीच फर्क यह है कि इंटीजर में पूर्णांक होते हैं और उन्हें L के साथ दर्शाना पड़ता है।
  3. कैरेक्टर डेटा हमेशा डबल कोट्स के अंदर लिखा जाता है और टेक्स्ट डेटा को मैनेज करने के लिए उपयोग किया जाता है।

वेरिएबल्स के साथ डेटा असाइन करना (Assigning Data to Variables)

Theoretical Content:
आर में वेरिएबल्स का उपयोग किसी भी प्रकार के डेटा को संग्रहीत करने के लिए किया जाता है। वेरिएबल्स असाइनमेंट ऑपरेटर (<- या =) के माध्यम से बनाए जाते हैं। आर की शक्ति इसी बात में है कि वेरिएबल्स में किसी भी प्रकार का डेटा स्टोर किया जा सकता है—चाहे वह न्यूमेरिक हो, कैरेक्टर हो, लॉजिकल हो या कोई अन्य डेटा टाइप।

वेरिएबल्स का नामकरण करते समय ध्यान दें कि नाम वर्णानुक्रम में शुरू होना चाहिए और उनमें स्पेशल कैरेक्टर्स (जैसे @, #, %) का उपयोग नहीं किया जा सकता है। हालांकि, अंडरस्कोर (_) और संख्या का उपयोग वेरिएबल्स के नाम में किया जा सकता है।

आर में वेरिएबल्स केस-सेंसिटिव होते हैं, इसलिए var1 और Var1 को अलग-अलग वेरिएबल्स के रूप में माना जाएगा। वेरिएबल्स के नाम जितने अधिक वर्णनात्मक होंगे, कोड की समझ उतनी ही बेहतर होगी, विशेष रूप से जब आप बड़े स्क्रिप्ट्स के साथ काम कर रहे हों।

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# वेरिएबल्स में डेटा असाइन करना
# Numeric डेटा असाइन करना
x <- 100
print(x) # 100
# Character डेटा असाइन करना
name <- "आर प्रोग्रामिंग"
print(name) # "आर प्रोग्रामिंग"
# Logical डेटा असाइन करना
flag <- TRUE
print(flag) # TRUE
# Multiple वेरिएबल्स को एक ही लाइन में असाइन करना
a <- b <- c <- 10
print(a) # 10
print(b) # 10
print(c) # 10
# वेरिएबल्स में डेटा असाइन करना # Numeric डेटा असाइन करना x <- 100 print(x) # 100 # Character डेटा असाइन करना name <- "आर प्रोग्रामिंग" print(name) # "आर प्रोग्रामिंग" # Logical डेटा असाइन करना flag <- TRUE print(flag) # TRUE # Multiple वेरिएबल्स को एक ही लाइन में असाइन करना a <- b <- c <- 10 print(a) # 10 print(b) # 10 print(c) # 10
# वेरिएबल्स में डेटा असाइन करना

# Numeric डेटा असाइन करना
x <- 100
print(x)  # 100

# Character डेटा असाइन करना
name <- "आर प्रोग्रामिंग"
print(name)  # "आर प्रोग्रामिंग"

# Logical डेटा असाइन करना
flag <- TRUE
print(flag)  # TRUE

# Multiple वेरिएबल्स को एक ही लाइन में असाइन करना
a <- b <- c <- 10
print(a)  # 10
print(b)  # 10
print(c)  # 10

इस कोड में, हमने विभिन्न डेटा प्रकारों को वेरिएबल्स में असाइन किया है:

  • x: न्यूमेरिक वैल्यू (100) को वेरिएबल x में संग्रहीत किया गया है।
  • name: एक कैरेक्टर स्ट्रिंग "आर प्रोग्रामिंग" को वेरिएबल name में संग्रहीत किया गया है।
  • flag: लॉजिकल वैल्यू TRUE को वेरिएबल flag में असाइन किया गया है।
  • a, b, और c: ये तीनों वेरिएबल्स एक ही लाइन में 10 की वैल्यू के साथ असाइन किए गए हैं, जो दिखाता है कि एक लाइन में एक से अधिक वेरिएबल्स को असाइन करना भी संभव है।

यह उदाहरण दिखाता है कि कैसे आर में विभिन्न प्रकार के डेटा को वेरिएबल्स में असाइन किया जा सकता है और फिर print() फंक्शन का उपयोग करके उन्हें आउटपुट किया जा सकता है। एक ही लाइन में एक से अधिक वेरिएबल्स को असाइन करने की क्षमता कोड को छोटा और संक्षिप्त बनाती है।

Notes:

  1. वेरिएबल्स में डेटा असाइन करने के लिए = और <- दोनों का उपयोग किया जा सकता है, लेकिन आर में <- अधिक आम है।
  2. आप किसी वेरिएबल के डेटा टाइप की पहचान class() फंक्शन के उपयोग से कर सकते हैं, जैसे class(x)
  3. एक ही वेरिएबल को बार-बार नए डेटा के साथ असाइन किया जा सकता है, और पिछली वैल्यू ओवरराइट हो जाती है। उदाहरण: x <- 5 के बाद x <- 10 करने से अब x की वैल्यू 10 हो जाएगी।

डेटा टाइप्स की पहचान कैसे करें (How to Identify Data Types in R)

आर प्रोग्रामिंग में किसी वेरिएबल या वैल्यू का डेटा टाइप जानना बेहद महत्वपूर्ण है क्योंकि इससे आपको यह समझने में मदद मिलती है कि कौन से ऑपरेशन्स उस डेटा के साथ किए जा सकते हैं। आर में डेटा टाइप्स की पहचान करने के लिए कुछ प्रमुख फंक्शन्स होते हैं, जो किसी वेरिएबल के प्रकार को इंगित करते हैं। इन फंक्शन्स की मदद से आप तुरंत यह जान सकते हैं कि वेरिएबल या वैल्यू किस प्रकार की है।

आर में डेटा टाइप्स की पहचान करने के लिए मुख्य फंक्शन्स निम्नलिखित हैं:

  1. class(): यह फंक्शन किसी वेरिएबल का डेटा टाइप (क्लास) बताता है।
  2. typeof(): यह फंक्शन डेटा के अंडरलाइन प्रकार को बताता है।
  3. is.numeric(), is.integer(), is.character(), is.logical(): ये फंक्शन्स किसी वेरिएबल के स्पेसिफिक डेटा टाइप को चेक करते हैं। अगर डेटा टाइप सही होता है, तो ये TRUE लौटाते हैं; अन्यथा, FALSE

इन फंक्शन्स का उपयोग करके आप सुनिश्चित कर सकते हैं कि आपके वेरिएबल्स में अपेक्षित डेटा है और उसके साथ कौन से ऑपरेशन्स किए जा सकते हैं।

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# डेटा टाइप्स की पहचान करने के उदाहरण
# Numeric वेरिएबल
x <- 5.5
print(class(x)) # "numeric"
print(typeof(x)) # "double"
print(is.numeric(x)) # TRUE
# Character वेरिएबल
y <- "Hello"
print(class(y)) # "character"
print(typeof(y)) # "character"
print(is.character(y)) # TRUE
# Logical वेरिएबल
z <- TRUE
print(class(z)) # "logical"
print(typeof(z)) # "logical"
print(is.logical(z)) # TRUE
# डेटा टाइप्स की पहचान करने के उदाहरण # Numeric वेरिएबल x <- 5.5 print(class(x)) # "numeric" print(typeof(x)) # "double" print(is.numeric(x)) # TRUE # Character वेरिएबल y <- "Hello" print(class(y)) # "character" print(typeof(y)) # "character" print(is.character(y)) # TRUE # Logical वेरिएबल z <- TRUE print(class(z)) # "logical" print(typeof(z)) # "logical" print(is.logical(z)) # TRUE
# डेटा टाइप्स की पहचान करने के उदाहरण

# Numeric वेरिएबल
x <- 5.5
print(class(x))       # "numeric"
print(typeof(x))      # "double"
print(is.numeric(x))  # TRUE

# Character वेरिएबल
y <- "Hello"
print(class(y))       # "character"
print(typeof(y))      # "character"
print(is.character(y))  # TRUE

# Logical वेरिएबल
z <- TRUE
print(class(z))       # "logical"
print(typeof(z))      # "logical"
print(is.logical(z))  # TRUE

इस कोड में, हमने तीन अलग-अलग वेरिएबल्स (x, y, और z) के डेटा टाइप्स की पहचान की है:

  • x: यह एक न्यूमेरिक वेरिएबल है और हमने class(x) और typeof(x) फंक्शन का उपयोग करके इसका डेटा टाइप पता किया। is.numeric(x) से पुष्टि होती है कि यह वेरिएबल न्यूमेरिक है।
  • y: यह एक कैरेक्टर वेरिएबल है। class(y) और typeof(y) ने दिखाया कि यह एक स्ट्रिंग है। is.character(y) से इसकी पुष्टि की गई।
  • z: यह एक लॉजिकल वेरिएबल है। class(z) और typeof(z) ने इसे लॉजिकल के रूप में पहचाना, और is.logical(z) ने सत्यापित किया कि यह वेरिएबल लॉजिकल है।

इन फंक्शन्स की मदद से हम यह सुनिश्चित कर सकते हैं कि वेरिएबल्स सही डेटा टाइप में हैं और आगे के ऑपरेशन्स के लिए उपयुक्त हैं।

Notes:

  1. class() फंक्शन आपको वेरिएबल की क्लास बताता है, जो आम तौर पर डेटा टाइप को इंगित करती है।
  2. typeof() फंक्शन आपको वेरिएबल के अंडरलाइन स्टोरेज प्रकार (जैसे “double”, “integer”, “character”) के बारे में अधिक जानकारी देता है।
  3. आप विशेष रूप से किसी डेटा टाइप की जांच करने के लिए is.numeric(), is.character(), is.logical() जैसे फंक्शन्स का उपयोग कर सकते हैं।


Index