Update check for inf/nan strings in libcudf float conversion to ignore case #9694

davidwendt · 2021-11-16T14:43:06Z

Reference https://github.com/rapidsai/cudf/pull/9613/files#r743579126

Add support to ignore case for strings INF, INFINITY and NAN to cudf::strings::is_float and cudf::strings::to_float for consistency with https://en.cppreference.com/w/cpp/string/basic_string/stof

Also, remove the expensive replace call in the cudf before calling this from Python.

cpp/include/cudf/strings/string.cuh

codecov · 2021-11-16T16:14:04Z

Codecov Report

Merging #9694 (828da0a) into branch-22.02 (967a333) will decrease coverage by 0.01%.
The diff coverage is 0.00%.

❗ Current head 828da0a differs from pull request most recent head e89b760. Consider uploading reports for the commit e89b760 to get more accurate results

@@               Coverage Diff                @@
##           branch-22.02    #9694      +/-   ##
================================================
- Coverage         10.49%   10.47%   -0.02%     
================================================
  Files               119      119              
  Lines             20305    20336      +31     
================================================
  Hits               2130     2130              
- Misses            18175    18206      +31

Impacted Files	Coverage Δ
python/cudf/cudf/__init__.py	`0.00% <0.00%> (ø)`
python/cudf/cudf/core/column/column.py	`0.00% <0.00%> (ø)`
python/cudf/cudf/core/column/string.py	`0.00% <ø> (ø)`
python/cudf/cudf/core/frame.py	`0.00% <0.00%> (ø)`
python/cudf/cudf/core/index.py	`0.00% <ø> (ø)`
python/cudf/cudf/core/indexed_frame.py	`0.00% <0.00%> (ø)`
python/cudf/cudf/core/multiindex.py	`0.00% <0.00%> (ø)`
python/cudf/cudf/utils/utils.py	`0.00% <0.00%> (ø)`

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update 27b7190...e89b760. Read the comment docs.

cpp/include/cudf/strings/string.cuh

robertmaynard

One small issue ( previous comment was before I found the logic that stripped - or + from before Nan/Inf

cpp/include/cudf/strings/string.cuh

davidwendt · 2021-11-23T13:15:58Z

@gpucibot merge

davidwendt added 3 commits November 11, 2021 15:38

Add support for INF and NAN strings in to_float

b1a036e

fix merge conflicts

ab5b7e5

Merge branch 'branch-22.02' into uppercase-inf-nan

6b68373

davidwendt added 2 - In Progress Currently a work in progress libcudf Affects libcudf (C++/CUDA) code. strings strings issues (C++ and Python) improvement Improvement / enhancement to an existing function non-breaking Non-breaking change labels Nov 16, 2021

davidwendt self-assigned this Nov 16, 2021

github-actions bot added the Python Affects Python cuDF API. label Nov 16, 2021

jrhemstad reviewed Nov 16, 2021

View reviewed changes

cpp/include/cudf/strings/string.cuh Outdated Show resolved Hide resolved

change check to ignore case

7bb28ea

davidwendt changed the title ~~Add check for upper-case inf/nan in libcudf float conversion~~ Update check for inf/nan strings in libcudf float conversion to ignore case Nov 16, 2021

remove commented out to-upper call

9a42811

davidwendt added 3 - Ready for Review Ready for review by team and removed 2 - In Progress Currently a work in progress labels Nov 17, 2021

davidwendt marked this pull request as ready for review November 17, 2021 18:16

davidwendt requested review from a team as code owners November 17, 2021 18:16

davidwendt requested review from robertmaynard, codereport, galipremsagar and charlesbluca November 17, 2021 18:16

jrhemstad reviewed Nov 17, 2021

View reviewed changes

cpp/include/cudf/strings/string.cuh Show resolved Hide resolved

robertmaynard reviewed Nov 17, 2021

View reviewed changes

cpp/include/cudf/strings/string.cuh Show resolved Hide resolved

fix edge case where only sign is present in the string

f5b5449

galipremsagar approved these changes Nov 17, 2021

View reviewed changes

robertmaynard approved these changes Nov 17, 2021

View reviewed changes

revans2 mentioned this pull request Nov 18, 2021

[FEA] Another look at infinity checking on casting string to float NVIDIA/spark-rapids#4152

Closed

Merge branch 'branch-22.02' into uppercase-inf-nan

ffbbfa4

ttnghia approved these changes Nov 19, 2021

View reviewed changes

Merge branch 'branch-22.02' into uppercase-inf-nan

7a9e250

Merge branch 'branch-22.02' into uppercase-inf-nan

f71b28b

codereport removed their request for review November 23, 2021 18:09

Merge branch 'branch-22.02' into uppercase-inf-nan

aeeefd1

davidwendt added 5 - Ready to Merge Testing and reviews complete, ready to merge and removed 3 - Ready for Review Ready for review by team labels Nov 29, 2021

davidwendt added 3 commits November 30, 2021 08:55

Merge branch 'branch-22.02' into uppercase-inf-nan

d125430

Merge branch 'branch-22.02' into uppercase-inf-nan

0c21f03

fix testIsFloat and testIsDouble

e89b760

github-actions bot added the Java Affects Java cuDF API. label Nov 30, 2021

davidwendt added 3 - Ready for Review Ready for review by team and removed 5 - Ready to Merge Testing and reviews complete, ready to merge labels Nov 30, 2021

davidwendt requested review from a team and removed request for a team and charlesbluca November 30, 2021 18:41

davidwendt requested a review from a team November 30, 2021 18:44

jlowe approved these changes Nov 30, 2021

View reviewed changes

rapids-bot bot merged commit 69d5765 into rapidsai:branch-22.02 Nov 30, 2021

davidwendt deleted the uppercase-inf-nan branch November 30, 2021 22:53

pxLi mentioned this pull request Dec 1, 2021

[BUG] Cast from string to float using hand-picked values failed NVIDIA/spark-rapids#4244

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update check for inf/nan strings in libcudf float conversion to ignore case #9694

Update check for inf/nan strings in libcudf float conversion to ignore case #9694

davidwendt commented Nov 16, 2021 •

edited

Loading

codecov bot commented Nov 16, 2021 •

edited

Loading

robertmaynard left a comment •

edited

Loading

davidwendt commented Nov 23, 2021

Update check for inf/nan strings in libcudf float conversion to ignore case #9694

Update check for inf/nan strings in libcudf float conversion to ignore case #9694

Conversation

davidwendt commented Nov 16, 2021 • edited Loading

codecov bot commented Nov 16, 2021 • edited Loading

Codecov Report

robertmaynard left a comment • edited Loading

Choose a reason for hiding this comment

davidwendt commented Nov 23, 2021

davidwendt commented Nov 16, 2021 •

edited

Loading

codecov bot commented Nov 16, 2021 •

edited

Loading

robertmaynard left a comment •

edited

Loading