अध्याय 7: समूहीकरण और एकत्रीकरण

अध्याय 7: समूहीकरण और एकत्रीकरण

डेटाबेस प्रबंधन में समूहीकरण (Grouping) और एकत्रीकरण (Aggregation) महत्वपूर्ण अवधारणाएँ हैं, जो हमें डेटा को सारांशित और विश्लेषण करने की अनुमति देती हैं। समूहीकरण के माध्यम से हम डेटा को विशेष श्रेणियों में विभाजित कर सकते हैं, जबकि एकत्रीकरण के माध्यम से हम उन श्रेणियों पर विभिन्न गणनाएँ (जैसे औसत, योग, न्यूनतम, अधिकतम आदि) कर सकते हैं। इस अध्याय में, हम GROUP BY और विभिन्न एकत्रीकरण फ़ंक्शंस (जैसे COUNT, SUM, AVG, MIN, MAX) के उपयोग को विस्तार से समझेंगे। इस अध्याय के अंत तक, आप SQL में डेटा को समूहीकृत और एकत्रित करने में दक्ष हो जाएंगे, जिससे आप अपने डेटाबेस से मूल्यवान अंतर्दृष्टि प्राप्त कर सकेंगे।

GROUP BY: डेटा को समूहित करना

GROUP BY क्लॉज SQL में एक महत्वपूर्ण उपकरण है, जो हमें डेटा को विशेष श्रेणियों में विभाजित करने और उन श्रेणियों पर एकत्रीकरण फ़ंक्शंस को लागू करने की अनुमति देता है। यह क्लॉज डेटा को समूहित करने और प्रत्येक समूह पर गणनाएँ (जैसे COUNT, SUM, AVG, MIN, MAX) करने के लिए उपयोगी है। इस सेक्शन में, हम GROUP BY क्लॉज का उपयोग करके डेटा को समूहित करने की प्रक्रिया को विस्तार से समझेंगे।

सिंटैक्स (Syntax)

GROUP BY क्लॉज का सामान्य सिंटैक्स निम्नलिखित है:

SELECT column1, column2, AGGREGATE_FUNCTION(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2;

उदाहरण (Examples)

  1. सरल समूहीकरण (Simple Grouping)

मान लीजिए हमारे पास एक students टेबल है जिसमें छात्रों की जानकारी है:

  • id
  • name
  • age
  • grade

हम grade के आधार पर छात्रों की गिनती करना चाहते हैं।

क्वेरी (Query):

SELECT grade, COUNT(*)
FROM students
GROUP BY grade;

परिणाम (Result): यह क्वेरी प्रत्येक ग्रेड के लिए छात्रों की गिनती को रिट्रीव करेगी।

radeCOUNT(*)
A3
B2
C1
  1. समूहीकरण और एकत्रीकरण (Grouping with Aggregation)

हम grade के आधार पर छात्रों की औसत आयु को रिट्रीव करना चाहते हैं।

क्वेरी (Query):

SELECT grade, AVG(age)
FROM students
GROUP BY grade;

परिणाम (Result): यह क्वेरी प्रत्येक ग्रेड के लिए छात्रों की औसत आयु को रिट्रीव करेगी।

gradeAVG(age)
A15.3
B14.5
C16.0
  1. समूहीकरण और फ़िल्टरिंग (Grouping with Filtering)

हम उन ग्रेड्स के लिए डेटा को रिट्रीव करना चाहते हैं जहां छात्रों की गिनती 2 से अधिक है।

क्वेरी (Query):

SELECT grade, COUNT(*)
FROM students
GROUP BY grade
HAVING COUNT(*) > 2;

परिणाम (Result): यह क्वेरी केवल उन ग्रेड्स को रिट्रीव करेगी जहां छात्रों की गिनती 2 से अधिक है।

gradeCOUNT(*)
A3

GROUP BY के साथ ORDER BY (ORDER BY with GROUP BY)

हम समूहीकृत डेटा को किसी विशेष क्रम में व्यवस्थित करना चाहते हैं।

क्वेरी (Query):

SELECT grade, COUNT(*)
FROM students
GROUP BY grade
ORDER BY COUNT(*) DESC;

परिणाम (Result): यह क्वेरी प्रत्येक ग्रेड के लिए छात्रों की गिनती को घटते क्रम (descending order) में रिट्रीव करेगी।

gradeCOUNT(*)
A3
B2
C1

महत्वपूर्ण बातें (Important Considerations)

  • HAVING क्लॉज: GROUP BY के बाद HAVING क्लॉज का उपयोग किया जाता है ताकि समूहीकृत डेटा पर अतिरिक्त फ़िल्टरिंग की जा सके।
  • NULL वैल्यूज: GROUP BY क्लॉज NULL वैल्यूज को भी समूहित करता है।
  • कॉलम चयन: SELECT स्टेटमेंट में केवल वे कॉलम शामिल होने चाहिए जो GROUP BY क्लॉज में हैं या एकत्रीकरण फ़ंक्शन के अंदर हैं।

समारोह (Functions): COUNT, SUM, AVG, MIN, MAX का उपयोग

SQL में एकत्रीकरण समारोह (aggregation functions) हमें डेटा पर गणनाएँ करने और सारांशित जानकारी प्राप्त करने की अनुमति देते हैं। सबसे सामान्य एकत्रीकरण समारोहों में COUNT, SUM, AVG, MIN, और MAX शामिल हैं। ये समारोह हमें रिकॉर्ड्स की गिनती करने, संख्यात्मक डेटा का योग और औसत निकालने, और न्यूनतम और अधिकतम मान प्राप्त करने में मदद करते हैं। इस सेक्शन में, हम इन समारोहों का उपयोग करके विभिन्न प्रकार की गणनाएँ कैसे की जाती हैं, इसे विस्तार से समझेंगे।

COUNT समारोह (COUNT Function)

COUNT समारोह का उपयोग रिकॉर्ड्स की गिनती करने के लिए किया जाता है।

सिंटैक्स (Syntax):

SELECT COUNT(column_name)
FROM table_name
WHERE condition;

उदाहरण (Example):

SELECT COUNT(*) AS total_students
FROM students;

यह क्वेरी students टेबल में कुल छात्रों की गिनती को रिट्रीव करेगी।

SUM समारोह (SUM Function)

SUM समारोह का उपयोग किसी कॉलम के सभी मानों का योग निकालने के लिए किया जाता है।

सिंटैक्स (Syntax):

SELECT SUM(column_name)
FROM table_name
WHERE condition;

उदाहरण (Example):

SELECT SUM(age) AS total_age
FROM students;

यह क्वेरी students टेबल में सभी छात्रों की आयु का कुल योग रिट्रीव करेगी।

AVG समारोह (AVG Function)

AVG समारोह का उपयोग किसी कॉलम के सभी मानों का औसत निकालने के लिए किया जाता है।

सिंटैक्स (Syntax):

SELECT AVG(column_name)
FROM table_name
WHERE condition;

उदाहरण (Example):

SELECT AVG(age) AS average_age
FROM students;

यह क्वेरी students टेबल में सभी छात्रों की आयु का औसत रिट्रीव करेगी।

MIN समारोह (MIN Function)

MIN समारोह का उपयोग किसी कॉलम का न्यूनतम मान (minimum value) प्राप्त करने के लिए किया जाता है।

सिंटैक्स (Syntax):

SELECT MIN(column_name)
FROM table_name
WHERE condition;

उदाहरण (Example):

SELECT MIN(age) AS youngest_student
FROM students;

यह क्वेरी students टेबल में सबसे कम आयु के छात्र की आयु को रिट्रीव करेगी।

MAX समारोह (MAX Function)

MAX समारोह का उपयोग किसी कॉलम का अधिकतम मान (maximum value) प्राप्त करने के लिए किया जाता है।

सिंटैक्स (Syntax):

SELECT MAX(column_name)
FROM table_name
WHERE condition;

उदाहरण (Example):

SELECT MAX(age) AS oldest_student
FROM students;

यह क्वेरी students टेबल में सबसे अधिक आयु के छात्र की आयु को रिट्रीव करेगी।

संयुक्त उदाहरण (Combined Example)

हम विभिन्न समारोहों का उपयोग करके students टेबल के डेटा का सारांश निकाल सकते हैं:

क्वेरी (Query):

SELECT 
    COUNT(*) AS total_students,
    SUM(age) AS total_age,
    AVG(age) AS average_age,
    MIN(age) AS youngest_student,
    MAX(age) AS oldest_student
FROM students;

परिणाम (Result):

total_studentstotal_ageaverage_ageyoungest_studentoldest_student
69015.01417

महत्वपूर्ण बातें (Important Considerations)

  • NULL वैल्यूज: अधिकांश एकत्रीकरण समारोह NULL वैल्यूज को अनदेखा करते हैं, सिवाय COUNT(*) के, जो सभी पंक्तियों की गिनती करता है।
  • समूह के साथ प्रयोग (Using with GROUP BY): एकत्रीकरण समारोह अक्सर GROUP BY क्लॉज के साथ प्रयोग किए जाते हैं ताकि प्रत्येक समूह पर गणनाएँ की जा सकें।
  • सटीकता और प्रदर्शन (Accuracy and Performance): बड़ी टेबल्स पर गणनाएँ करते समय प्रदर्शन को ध्यान में रखें। इंडेक्सिंग और अन्य ऑप्टिमाइजेशन तकनीकों का उपयोग करें।


Index