巧用Left join代替not in

/ mysql / 没有评论 / 2503浏览

很多人都知道 在各种数据库里面 not in 的效率极其低下.例如

select * from a
where a.id not in (
     select id from b
)

我们假如a表有 10万条记录, 而b表里面也有10万条记录, 那么需要的判断是 10万 乘以 10万 ,则是100亿次判断.所以执行效率极其低下. 即使发现存在就返回.那么也有 100亿/2=50亿次判断.

此时,我们可以用 Left join 来进行判断则快很多

select a.* from a
left join b
     on a.id=b.id
where b.id is null

我相信这句语句大家都看的懂,相对来说.这里只要进行10万数据连接,然后进行10万次判断就可以了.总共只有20万次. 而10万数据连接来说,速度是很快的.

100亿/20万 相差 5万倍速度.
50亿/20万 相差 2.5万倍速度.

对于这个来说,假如a 表的数据越多,则提成的越快.

当然我这个上面涉及的是 a,b表里面都没有重复的ID,假如涉及到重复的ID.则可以通过 except 等字进行过滤.从而提高连接速度. 而在 distinct 和 left join 之间的效率就需要你的经验来判断了 .