由于 getValue 和单元格插入可能导致处理时间过长

IT技术 javascript optimization multidimensional-array google-apps-script google-sheets
2021-01-13 20:30:12

我刚刚编写了我的第一个谷歌应用程序脚本,从 VBA 移植而来,它格式化了一列客户订单信息(感谢您的指导)。

描述:

该代码通过 - 前缀标识州代码,然后将以下名字与姓氏(如果存在)组合在一起。然后在姓氏所在的位置写下“订单完成”。最后,如果订单之间没有间隙,它会插入一个必要的空白单元格(见下图)。

问题:

问题是处理时间它无法处理更长的数据列。我被警告说

方法 Range.getValue 被脚本大量使用。

现有优化:

根据对这个问题的回答,我尝试将尽可能多的变量保留在循环之外,并且还改进了我的 if 语句。@MuhammadGelbana 建议只调用 Range.getValue 方法一次并移动它的值......但我不明白这将/可能如何工作。

代码:

function format() {

var ss = SpreadsheetApp.getActiveSpreadsheet();
var s = ss.getActiveSheet();
var lastRow = s.getRange("A:A").getLastRow();
var row, range1, cellValue, dash, offset1, offset2, offset3;

  //loop through all cells in column A
  for (row = 0; row < lastRow; row++) {
    range1 = s.getRange(row + 1, 1);

    //if cell substring is number, skip it
    //because substring cannot process numbers
    cellValue = range1.getValue();
    if (typeof cellValue === 'number') {continue;};
    dash = cellValue.substring(0, 1);

    offset1 = range1.offset(1, 0).getValue();
    offset2 = range1.offset(2, 0).getValue();
    offset3 = range1.offset(3, 0).getValue();

    //if -, then merge offset cells 1 and 2
    //and enter "Order complete" in offset cell 2.
    if (dash === "-") {
       range1.offset(1, 0).setValue(offset1 + " " + offset2);
       //Translate
       range1.offset(2, 0).setValue("Order complete");
     };

    //The real slow part...
    //if - and offset 3 is not blank, then INSERT CELL
    if (dash === "-" && offset3) {
       //select from three rows down to last
       //move selection one more row down (down 4 rows total)
       s.getRange(row + 1, 1, lastRow).offset(3, 0).moveTo(range1.offset(4, 0));
     };    
  };
}

截图示例

格式更新:

有关使用字体或背景颜色格式化输出的指导,请在此处查看此后续问题希望您能从这些专业人士给我的建议中受益:)

2个回答

问题:

  • 在循环中使用.getValue()和 会.setValue()导致处理时间增加。

文档摘录:

  • 尽量减少对服务的调用:

您可以在 Google Apps Script 本身内完成的任何事情都比调用需要从 Google 的服务器或外部服务器获取数据的调用快得多,例如对电子表格、文档、站点、翻译、UrlFetch 等的请求。

  • 提前缓存:

Google Apps Script 已经有一些内置优化,例如使用前瞻缓存来检索脚本可能获得的内容,并编写缓存来保存可能设置的内容。

  • 最小化读/写的“数量”:

您可以编写脚本以最大限度地利用内置缓存,通过最小化读取和写入次数。

  • 避免交替读/写:

交替读写命令很慢

  • 使用数组:

为了加速脚本,用一个命令将所有数据读入一个数组,对数组中的数据执行任何操作,然后用一个命令将数据写出。

慢速脚本示例:

/** 
 * Really Slow script example
 * Get values from A1:D2
 * Set values to A3:D4
 */

function slowScriptLikeVBA(){
  const ss = SpreadsheetApp.getActive();
  const sh = ss.getActiveSheet();
  //get A1:D2 and set it 2 rows down
  for(var row = 1; row <= 2; row++){
    for(var col = 1; col <= 4; col++){
      var sourceCellRange = sh.getRange(row, col, 1, 1);
      var targetCellRange = sh.getRange(row + 2, col, 1, 1);
      var sourceCellValue = sourceCellRange.getValue();//1 read call per loop
      targetCellRange.setValue(sourceCellValue);//1 write call per loop
    }
  }
}
  • 请注意,每个循环进行了两次调用。有两个循环;在此示例中,针对 2x4 数组的简单复制粘贴进行了 8 次读取调用和 8 次写入调用。
  • 此外,请注意读取和写入调用交替使“前瞻”缓存无效。
  • 调用服务总数:16
  • 所用时间:~5+ 秒

快速脚本示例:

/** 
 * Fast script example
 * Get values from A1:D2
 * Set values to A3:D4
 */

function fastScript(){
  const ss = SpreadsheetApp.getActive();
  const sh = ss.getActiveSheet();
  //get A1:D2 and set it 2 rows down
  var sourceRange = sh.getRange("A1:D2");
  var targetRange = sh.getRange("A3:D4");
  var sourceValues = sourceRange.getValues();//1 read call in total
  //modify `sourceValues` if needed
  //sourceValues looks like this two dimensional array:
  //[//outer array containing rows array
  // ["A1","B1","C1",D1], //row1(inner) array containing column element values
  // ["A2","B2","C2",D2],
  //]
  //@see https://stackoverflow.com/questions/63720612
  targetRange.setValues(sourceValues);//1 write call in total
}
  • 调用服务总数:2
  • 所用时间:~0.2 秒

参考:

使用像.getValue()和 之类的方法.moveTo()在执行时间上可能非常昂贵。另一种方法是使用批处理操作,获取所有列值并在一次调用中写入工作表之前根据需要遍历数据整形。当您运行脚本时,您可能已经注意到以下警告:

该脚本使用了一种被认为成本高昂的方法。每次调用都会生成对远程服务器的耗时调用。这可能会对脚本的执行时间产生严重影响,尤其是在大数据上。如果脚本的性能是一个问题,您应该考虑使用另一种方法,例如 Range.getValues()。

使用.getValues().setValues()你的脚本可以改写为:

function format() {

  var ss = SpreadsheetApp.getActiveSpreadsheet();
  var s = ss.getActiveSheet();
  var lastRow = s.getLastRow(); // more efficient way to get last row
  var row;

  var data = s.getRange("A:A").getValues(); // gets a [][] of all values in the column
  var output = []; // we are going to build a [][] to output result

  //loop through all cells in column A
  for (row = 0; row < lastRow; row++) {
    var cellValue = data[row][0];
    var dash = false;
    if (typeof cellValue === 'string') {
      dash = cellValue.substring(0, 1); 
    } else { // if a number copy to our output array
      output.push([cellValue]); 
    }
    // if a dash  
    if (dash === "-") {
      var name = (data[(row+1)][0]+" "+data[(row+2)][0]).trim(); // build name
      output.push([cellValue]); // add row -state
      output.push([name]); // add row name 
      output.push(["Order complete"]); // row order complete
      output.push([""]); // add blank row
      row++; // jump an extra row to speed things up
    } 
  }
  s.clear(); // clear all existing data on sheet
  // if you need other data in sheet then could
  // s.deleteColumn(1);
  // s.insertColumns(1);

  // set the values we've made in our output [][] array
  s.getRange(1, 1, output.length).setValues(output);
}

用 20 行数据测试你的脚本发现执行需要 4.415 秒,上面的代码在 0.019 秒内完成

我无法弄清楚,但我能够简单地使用 matrix.push(['The order ' + name + ' has been processing!']); 谢谢大佬,结案!
2021-03-22 20:30:12
getValues() 返回一个基本数组对象,因此无法访问 getA1Notation()。但是,您可以使用当前output.length()来计算一行,例如 rowPlus1 = "Order in cell range A"+(output.length()+1)+" is complete! "; (未经测试,您可能需要将 +1 调整为 +2)
2021-04-03 20:30:12
作为最后一步,使用这种 [ ] 推送技术时是否可以调用函数?即 var rowPlus1 = (data[(row+1)[0]]).getA1Notation() -> ="单元格范围内的订单" + rowPlus1 + " 已完成!" ->“单元格区域 A5 中的订单已完成!”
2021-04-06 20:30:12