MySQL 实现行转列SQL

/ mysql / 没有评论 / 1696浏览

概述

好久没写SQL语句,今天看到问答中的一个问题,拿来研究一下。

问题链接:关于Mysql 的分级输出问题

情景简介

学校里面记录成绩,每个人的选课不一样,而且以后会添加课程,所以不需要把所有课程当作列。数据表里面数据如下图,使用姓名+课程作为联合主键(有些需求可能不需要联合主键)。本文以MySQL为基础,其他数据库会有些许语法不同。

数据库表数据

imgimg

行转列成绩显示,处理后的结果:

方法一

这里可以使用Max,也可以使用Sum,注意第二张图,当有学生的某科成绩缺失的时候,输出结果为Null;

SELECT  
    SNAME,
    MAX(CASE CNAME WHEN 'JAVA' THEN SCORE END) JAVA,  
    MAX(CASE CNAME WHEN 'mysql' THEN SCORE END) mysql  
FROM stdscore GROUP BY SNAME;  

可以在第一个Case中加入Else语句解决这个问题:

SELECT  
    SNAME,  
    MAX(CASE CNAME WHEN 'JAVA' THEN SCORE ELSE 0 END) JAVA,  
    MAX(CASE CNAME WHEN 'mysql' THEN SCORE ELSE 0 END) mysql  
FROM  stdscore  GROUP BY SNAME;  

方法二:

SELECT DISTINCT  a.sname,  
(SELECT score FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='JAVA' ) AS 'JAVA',  
(SELECT score FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='mysql' ) AS 'mysql'  
FROM stdscore a  

方法三:

DROP PROCEDURE  
IF EXISTS sp_score;  
DELIMITER &&  

CREATE PROCEDURE sp_score ()  
BEGIN  
    #课程名称  
    DECLARE cname_n VARCHAR (20) ; #所有课程数量  
    DECLARE count INT ; #计数器  
    DECLARE i INT DEFAULT 0 ; #拼接SQL字符串  
    SET @s = 'SELECT sname' ;  
    SET count = (SELECT COUNT(DISTINCT cname) FROM stdscore);  
    WHILE i < count DO  
        SET cname_n = (SELECT cname FROM stdscore GROUP BY CNAME LIMIT i,1) ;  
        SET @s = CONCAT(@s,', SUM(CASE cname WHEN ','\'',cname_n,'\'', 
                        ' THEN score ELSE 0 END)', ' AS ','\'',cname_n,'\'') ;  
        SET i = i + 1 ;  
     END WHILE ;  
     SET @s = CONCAT(@s,' FROM stdscore GROUP BY sname') ; 
     #用于调试  
     #SELECT @s;  
     PREPARE stmt FROM @s ; 
     EXECUTE stmt ;
END&&  

CALL sp_score () ;  

行转列分级输出(处理后的结果):

imgimg

方法一

这里可以使用Max,也可以使用Sum;注意第二张图,当有学生的某科成绩缺失的时候,输出结果为Null;

SELECT  
  SNAME,  
  MAX(CASE CNAME WHEN 'JAVA' THEN (CASE 
    WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN '优秀' 
    WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN '良好'  
    WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN '普通'  
    ELSE '较差' END) END) JAVA,  
  MAX(CASE CNAME WHEN 'mysql' THEN (CASE  
    WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='mysql') > 20 THEN '优秀'  
    WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='mysql') > 10 THEN '良好'  
    WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='mysql') >= 0 THEN '普通'  
    ELSE '较差' END) END ) mysql  
FROM stdscore  
GROUP BY SNAME;  

针对本SQL语句可以采取先算平均值,然后用LEFT优化。不然在数据量大时非常慢。

方法二:

SELECT DISTINCT a.sname,  
(SELECT (CASE 
 WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN '优秀'  
 WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN '良好'  
 WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN '普通'  
 ELSE '较差' END ) FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='JAVA' ) AS 'JAVA',  
(SELECT (CASE  
 WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN '优秀'  
 WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN '良好'  
 WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN '普通'  
 ELSE '较差' END ) FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='mysql' ) AS 'mysql' 
FROM stdscore a  

针对本SQL语句可以采取先算平均值,然后用LEFT优化。不然在数据量大时非常慢。

方法三:

DROP PROCEDURE  
IF EXISTS sp_score;  
DELIMITER &&  
  
CREATE PROCEDURE sp_score ()  
BEGIN  
    #课程名称  
    DECLARE  cname_n VARCHAR (20) ; 
    #所有课程数量  
    DECLARE count INT ; 
    #计数器  
    DECLARE  i INT DEFAULT 0 ; 
    #拼接SQL字符串  
    SET @s = 'SELECT sname' ;  
    SET count = (SELECT COUNT(DISTINCT cname) FROM stdscore) ;  
    WHILE i < count DO  
				 SET cname_n = (SELECT cname FROM stdscore GROUP BY CNAME LIMIT i, 1) ;  
       SET @s = CONCAT(@s,', MAX(CASE cname WHEN \'', cname_n,  
            '\' THEN (CASE 
            WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') > 											20 THEN \'优秀\' 
            WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') > 											10 THEN \'良好\'  
            WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') >= 
                0 THEN \'普通\'  
            ELSE \'较差\' END) END) AS \'',cname_n,'\'') ;  
       SET i = i + 1 ;  
    END WHILE ;  
    SET @s = CONCAT(@s,' FROM stdscore GROUP BY sname') ;   
    #用于调试  
    #SELECT @s;  
    PREPARE stmt FROM @s; 
    EXECUTE stmt ;  
END&&  

CALL sp_score ();  

几种方法比较分析

小结

关于行转列和列转行

这个概念似乎容易弄混,有人把行转列理解为列转行,有人把列转行理解为行转列;这里做个定义:

关于效率

不知道有什么好的生成模拟数据的方法或工具,麻烦小伙伴推荐一下,抽空我做一下对比;

还有其它更好的方法吗?

有些需求可能不需要联合主键

有些需求可能不需要联合主键,因为一门课程可能允许学生考多次,取最好的一次成绩,或者取多次的平均成绩。