转换度量单位


10

寻找一种最合适的计量单位清单,列出以不同(但兼容)单位体积给出的物质。

单位换算表

单位转换表存储各种单位以及这些单位之间的关系:

id  unit          coefficient                 parent_id
36  "microlitre"  0.0000000010000000000000000 37
37  "millilitre"  0.0000010000000000000000000 5
 5  "centilitre"  0.0000100000000000000000000 18
18  "decilitre"   0.0001000000000000000000000 34
34  "litre"       0.0010000000000000000000000 19
19  "dekalitre"   0.0100000000000000000000000 29
29  "hectolitre"  0.1000000000000000000000000 33
33  "kilolitre"   1.0000000000000000000000000 35
35  "megalitre"   1000.0000000000000000000000 0

按系数排序显示parent_id链接将子单元与其数字上级链接。

可以使用以下方法在PostgreSQL中创建该表:

CREATE TABLE unit_conversion (
  id serial NOT NULL, -- Primary key.
  unit text NOT NULL, -- Unit of measurement name.
  coefficient numeric(30,25) NOT NULL DEFAULT 0, -- Conversion value.
  parent_id integer NOT NULL DEFAULT 0, -- Relates units in order of increasing measurement volume.
  CONSTRAINT pk_unit_conversion PRIMARY KEY (id)
)

应该有一个从parent_id到的外键id

物质表

物质表列出了特定数量的物质。例如:

 id  unit          label     quantity
 1   "microlitre"  mercury   5
 2   "millilitre"  water     500
 3   "centilitre"  water     2
 4   "microlitre"  mercury   10
 5   "millilitre"  water     600

该表可能类似于:

CREATE TABLE substance (
  id bigserial NOT NULL, -- Uniquely identifies this row.
  unit text NOT NULL, -- Foreign key to unit conversion.
  label text NOT NULL, -- Name of the substance.
  quantity numeric( 10, 4 ) NOT NULL, -- Amount of the substance.
  CONSTRAINT pk_substance PRIMARY KEY (id)
)

问题

您将如何创建一个查询,该查询使用具有整数(以及可选的实数部分)的最少数字来表示物质的总和?

例如,您将如何返回:

  quantity  unit        label
        15  microlitre  mercury 
       112  centilitre  water

但不是:

  quantity  unit        label
        15  microlitre  mercury 
      1.12  litre       water

因为112的实数少于1.12,而112的实数少于1120。但是在某些情况下,使用实数的数更短-例如1.1升对110厘升。

通常,我很难根据递归关系选择正确的单位。

源代码

到目前为止,我(显然无法正常工作):

-- Normalize the quantities
select
  sum( coefficient * quantity ) AS kilolitres
from
  unit_conversion uc,
  substance s
where
  uc.unit = s.unit
group by
  s.label

主意

这是否需要使用日志10来确定位数?

约束条件

单位并非全部具有十的幂。例如:http : //unitsofmeasure.org/ucum-essence.xml


3
@mustaccio我在以前的生产系统上也遇到过同样的问题。在那里,我们必须计算送餐厨房中使用的数量。
dezso 2013年

2
我记得至少有两级递归CTE。我想我首先用给定物质在列表中出现的最小单位求和,然后将其转换为仍具有非零整数部分的最大单位。
dezso 2013年

1
所有单位都能用10的幂转换吗?您的单位清单是否完整?
Erwin Brandstetter

Answers:


2

这看起来很丑:

  with uu(unit, coefficient, u_ord) as (
    select
     unit, 
     coefficient,
     case 
      when log(u.coefficient) < 0 
      then floor (log(u.coefficient)) 
      else ceil(log(u.coefficient)) 
     end u_ord
    from
     unit_conversion u 
  ),
  norm (label, norm_qty) as (
   select
    s.label,
    sum( uc.coefficient * s.quantity ) AS norm_qty
  from
    unit_conversion uc,
    substance s
  where
    uc.unit = s.unit
  group by
    s.label
  ),
  norm_ord (label, norm_qty, log, ord) as (
   select 
    label,
    norm_qty, 
    log(t.norm_qty) as log,
    case 
     when log(t.norm_qty) < 0 
     then floor(log(t.norm_qty)) 
     else ceil(log(t.norm_qty)) 
    end ord
   from norm t
  )
  select
   norm_ord.label,
   norm_ord.norm_qty,
   norm_ord.norm_qty / uu.coefficient val,
   uu.unit
  from 
   norm_ord,
   uu where uu.u_ord = 
     (select max(uu.u_ord) 
      from uu 
      where mod(norm_ord.norm_qty , uu.coefficient) = 0);

但似乎可以解决问题:

|   LABEL | NORM_QTY | VAL |       UNIT |
-----------------------------------------
| mercury |   1.5e-8 |  15 | microlitre |
|   water |  0.00112 | 112 | centilitre |

您实际上并不需要表中的父子关系unit_conversion,因为coefficient只要您确定了家庭,同一个家庭中的单位就自然会以的顺序彼此关联。


2

我认为,这可以大大简化。

1.修改unit_conversion表格

或者,如果您不能修改表,只需添加exp10“指数基数10” 列,该列与要在十进制系统中移动的位数一致:

CREATE TABLE unit_conversion(
   unit text PRIMARY KEY
  ,exp10 int
);

INSERT INTO unit_conversion VALUES
     ('microlitre', 0)
    ,('millilitre', 3)
    ,('centilitre', 4)
    ,('litre',      6)
    ,('hectolitre', 8)
    ,('kilolitre',  9)
    ,('megalitre',  12)
    ,('decilitre',  5);

2.写功能

计算左移或右移的位数:

CREATE OR REPLACE FUNCTION f_shift_comma(n numeric)
  RETURNS int LANGUAGE SQL IMMUTABLE AS
$$
SELECT CASE WHEN ($1 % 1) = 0 THEN                    -- no fractional digits
          CASE WHEN ($1 % 10) = 0 THEN 0              -- no trailing 0, don't shift
          ELSE length(rtrim(trunc($1, 0)::text, '0')) -- trunc() because numeric can be 1.0
                   - length(trunc($1, 0)::text)       -- trailing 0, shift right .. negative
          END
       ELSE                                           -- fractional digits
          length(rtrim(($1 % 1)::text, '0')) - 2      -- shift left .. positive
       END
$$;

3.查询

SELECT DISTINCT ON (substance_id)
       s.substance_id, s.label, s.quantity, s.unit
      ,COALESCE(s.quantity * 10^(u1.exp10 - u2.exp10)::numeric
              , s.quantity)::float8 AS norm_quantity
      ,COALESCE(u2.unit, s.unit) AS norm_unit
FROM   substance s 
JOIN   unit_conversion u1 USING (unit)
LEFT   JOIN unit_conversion u2 ON f_shift_comma(s.quantity) <> 0
                              AND @(u2.exp10 - (u1.exp10 - f_shift_comma(s.quantity))) < 2
                              -- since maximum gap between exp10 in unit table = 3
                              -- adapt to ceil(to max_gap / 2) if you have bigger gaps
ORDER  BY s.substance_id
     , @(u2.exp10 - (u1.exp10 - f_shift_comma(s.quantity))) -- closest unit first
     , u2.exp10    -- smaller unit first to avoid point for ties.

说明:

  • 联接物质和单位表。
  • f_shift_comma()从上面计算出要移动的理想位置数。
  • 再次左移至单位表以查找接近最佳单位。
  • DISTINCT ON ()和选择最接近的单位ORDER BY
  • 如果找不到更好的单位,请退回给我们的东西COALESCE()
  • 这应该涵盖所有极端情况,并且速度很快

-> SQLfiddle演示。


1
@DaveJarvis:我以为我已经涵盖了所有内容……这个细节对于原本精心设计的问题确实很有帮助。
Erwin Brandstetter
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.