Решение на CSV Filter от Йордан Миронски

Обратно към всички решения

Към профила на Йордан Миронски

Резултати

  • 8 точки от тестове
  • 0 бонус точки
  • 8 точки общо
  • 8 успешни тест(а)
  • 7 неуспешни тест(а)

Код

pub fn skip_next(input: &str, target: char) -> Option<&str>
{
if input.chars().nth(0) == Some(target)
{
return Some(&input[1..]);
}
None
}
/// Търси следващото срещане на символа `target` в низа `input`. Връща низа до този символ и низа
/// от този символ нататък, в двойка.
///
/// Ако не намери `target`, връща оригиналния низ и празен низ като втори елемент в двойката.
///
/// take_until(" foo/bar ", '/') //=> (" foo", "/bar ")
/// take_until("foobar", '/') //=> ("foobar", "")
///
pub fn take_until(input: &str, target: char) -> (&str, &str)
{
for i in 0..input.len()
{
if input.chars().nth(i) == Some(target)
{
return (&input[..i],&input[i..]);
}
}
return (&input[..],&"");
}
/// Комбинация от горните две функции -- взема символите до `target` символа, и връща частта преди
/// символа и частта след, без самия символ. Ако символа го няма, връща `None`.
///
/// take_and_skip(" foo/bar ", '/') //=> Some((" foo", "bar "))
/// take_and_skip("foobar", '/') //=> None
///
pub fn take_and_skip(input: &str, target: char) -> Option<(&str, &str)>
{
for i in 0..input.len()
{
if input.chars().nth(i) == Some(target)
{
return Some((&input[..i],&input[i+1..]));
}
}
None
}
#[derive(Debug)]
pub enum CsvError
{
IO(std::io::Error),
ParseError(String),
InvalidHeader(String),
InvalidRow(String),
InvalidColumn(String),
}
use std::collections::HashMap;
type Row = HashMap<String, String>;
use std::io::BufRead;
pub struct Csv<R: BufRead>
{
pub columns: Vec<String>,
reader: R,
selection: Option<Box<dyn Fn(&Row) -> Result<bool, CsvError>>>,
}
use std::io::Write;
impl<R: BufRead> Csv<R>
{
/// Конструира нова стойност от подадения вход. Третира се като "нещо, от което може да се чете
/// ред по ред".
///
/// Очакваме да прочетете първия ред от входа и да го обработите като заглавна част ("header").
/// Това означава, че първия ред би трябвало да включва имена на колони, разделени със
/// запетайки и може би празни места. Примерно:
///
/// - name, age
/// - name,age,birth date
///
/// В случай, че има грешка от викане на методи на `reader`, тя би трябвало да е `io::Error`.
/// върнете `CsvError::IO`, което опакова въпросната грешка.
///
/// Ако първия ред е празен, прочитането ще ви върне 0 байта. Примерно, `read_line` връща
/// `Ok(0)` в такъв случай. Това означава, че нямаме валиден header -- нито една колона няма,
/// очакваме грешка `CsvError::InvalidHeader`.
///
/// Ако има дублиране на колони -- две колони с едно и също име -- също върнете
/// `CsvError::InvalidHeader`.
///
/// Ако всичко е наред, върнете конструирана стойност, на която `columns` е списък с колоните,
/// в същия ред, в който са подадени, без заобикалящите ги празни символи (използвайте
/// `.trim()`).
///
pub fn new(mut reader: R) -> Result<Self, CsvError>
{
let mut c = Vec::new();
let mut first_line = String::new();
let result = reader.read_line(&mut first_line);
if !result.is_ok()
{
return Err(CsvError::IO(result.unwrap_err()));
}
if result.unwrap() == 0
{
return Err(CsvError::InvalidHeader("empty first line".to_string()));
}
let mut x = take_and_skip(&first_line,',');
while x != None
{
let prev = x;
c.push(x.unwrap().0.trim().to_string());
x = take_and_skip(x.unwrap().1,',');
if x == None
{
c.push(prev.unwrap().1.trim().to_string());
}
}
let c1 = c.clone();
c.sort();
for i in 0..c.len() - 1
{
if c[i] == c[i+1]
{
return Err(CsvError::InvalidHeader("duplicate columns".to_string()));
}
}
let s = None;
return Ok(Csv {columns:c1,reader: reader,selection:s});
}
/// Функцията приема следващия ред за обработка и конструира `Row` стойност
/// (`HashMap<String, String>`) със колоните и съответсващите им стойности на този ред.
///
/// Алгоритъма е горе-долу:
///
/// 1. Изчистете реда с `.trim()`.
/// 2. Очаквате, че реда ще започне със `"`, иначе връщате грешка.
/// 3. Прочитате съдържанието от отварящата кавичка до следващата. Това е съдържанието на
/// стойността на текущата колона на този ред. Не го чистите от whitespace, просто го
/// приемате както е.
/// 4. Ако не намерите затваряща кавичка, това е грешка.
/// 5. Запазвате си стойността в един `Row` (`HashMap`) -- ключа е името на текущата колона,
/// до която сте стигнали, стойността е това, което току-що изпарсихте.
/// 6. Ако нямате оставащи колони за обработка и нямате оставащо съдържание от реда, всичко
/// е ок. Връщате реда.
/// 7. Ако нямате оставащи колони, но имате още от реда, или обратното, това е грешка.
///
/// За този процес, помощните функции, които дефинирахме по-горе може да ви свършат работа.
/// *Може* да използвате вместо тях `.split` по запетайки, но ще имаме поне няколко теста със
/// вложени запетайки. Бихте могли и с това да се справите иначе, разбира се -- ваш избор.
///
/// Внимавайте с празното пространство преди и след запетайки -- викайте `.trim()` на ключови
/// места. Всичко в кавички се взема както е, всичко извън тях се чисти от whitespace.
///
/// Всички грешки, които ще връщате, се очаква да бъдат `CsvError::InvalidRow`.
///
pub fn parse_line(&mut self, line: &str) -> Result<Row, CsvError>
{
let z = &line.trim();
let mut r = Row::new();
let next = skip_next(&z, '"');
if next == None
{
return Err(CsvError::InvalidRow("dosnt start correctly".to_string()));
}
let mut x = Some((next.unwrap(),next.unwrap()));
for i in 0..self.columns.len()
{
let prev = x;
x = take_and_skip(x.unwrap().1, '"');
if x.unwrap().0 == prev.unwrap().0 && i == self.columns.len()
{
return Err(CsvError::InvalidRow("dosnt have a closing symbol".to_string()));
}
r.insert(self.columns[i].clone(), x.unwrap().0.to_string());
if x == None
{
break;
}
if i < self.columns.len() - 1
{
x = take_and_skip(x.unwrap().1, ',');
if x == None
{
return Err(CsvError::InvalidRow("err".to_string()));
}
x = take_and_skip(x.unwrap().1, '"');
if x == None
{
return Err(CsvError::InvalidRow("err".to_string()));
}
}
}
return Ok(r);
}
/// Подадената функция, "callback", се очаква да се запази и да се използва по-късно за
/// филтриране -- при итерация, само редове, за които се връща `true` се очаква да се извадят.
///
/// Би трябвало `callback` да се вика от `.next()` и от `.write_to()`, вижте описанията на тези
/// методи за детайли.
///
pub fn apply_selection<F>(&mut self, callback: F)
where F: Fn(&Row) -> Result<bool, CsvError> + 'static
{
self.selection = Some(Box::new(callback));
}
/// Извикването на този метод консумира CSV-то и записва филтрираното съдържание в подадената
/// `Write` стойност. Вижте по-долу за пример и детайли.
///
/// Грешките, които се връщат са грешките, които идват от използваните други методи, плюс
/// грешките от писане във `writer`-а, опаковани в `CsvError::IO`.
///
/// В зависимост от това как си имплементирате метода, `mut` може би няма да ви трябва за
/// `self` -- ако имате warning-и, просто го махнете.
///
pub fn write_to<W: Write>(mut self, mut writer: W) -> Result<(), CsvError>
{
for i in 0..self.columns.len()
{
let x = writer.write(self.columns[i].as_bytes());
if x.is_err()
{
return Err(CsvError::IO(x.unwrap_err()));
}
if i != self.columns.len() - 1
{
let x = writer.write(", ".as_bytes());
if x.is_err()
{
return Err(CsvError::IO(x.unwrap_err()));
}
}
}
let x = writer.write("\n".as_bytes());
if x.is_err()
{
return Err(CsvError::IO(x.unwrap_err()));
}
while let x = &self.next()
{
if x.is_none()
{
break;
}
let row = x.as_ref().unwrap();
let mut count = 0;
match row
{
Ok(hmap) => for key in &self.columns
{
writer.write("\"".as_bytes());
writer.write(hmap[key.as_str()].as_bytes());
writer.write("\"".as_bytes());
if count != &self.columns.len() - 1
{
writer.write(", ".as_bytes());
}
else
{
continue;
}
count += 1;
} ,
Err(er) => return Ok(()),
};
writer.write("\n".as_bytes());
}
Ok(())
}
}
impl<R: BufRead> Iterator for Csv<R>
{
type Item = Result<Row, CsvError>;
/// Итерацията се състои от няколко стъпки:
///
/// 1. Прочитаме следващия ред от входа:
/// -> Ако има грешка при четене, връщаме Some(CsvError::IO(...))
/// -> Ако успешно се прочетат 0 байта, значи сме на края на входа, и няма какво повече да
/// четем -- връщаме `None`
/// -> Иначе, имаме успешно прочетен ред, продължаваме напред
/// 2. Опитваме се да обработим прочетения ред със `parse_line`:
/// -> Ако има грешка при парсене, връщаме Some(CsvError-а, който се връща от `parse_line`)
/// -> Ако успешно извикаме `parse_line`, вече имаме `Row` стойност.
/// 3. Проверяваме дали този ред изпълнява условието, запазено от `apply_selection`:
/// -> Ако условието върне грешка, връщаме тази грешка опакована във `Some`.
/// -> Ако условието върне Ok(false), *не* връщаме този ред, а пробваме следващия (обратно
/// към стъпка 1)
/// -> При Ok(true), връщаме този ред, опакован във `Some`
///
/// Да, тази функция връща `Option<Result<...>>` :). `Option` защото може да има, може да няма
/// следващ ред, `Result` защото четенето на реда (от примерно файл) може да не сработи.
///
fn next(&mut self) -> Option<Self::Item>
{
let mut l = String::new();
let result = self.reader.read_line(&mut l);
if !result.is_ok()
{
return Some(Err(CsvError::IO(result.unwrap_err())));
}
if result.unwrap() == 0
{
return None;
}
let parse_result = self.parse_line(&l.clone());
if parse_result.is_err()
{
return Some(parse_result);
}
match self.selection.as_ref().unwrap()(&parse_result.as_ref().unwrap())
{
Err(_) => return Some(Err(CsvError::ParseError("err".to_string()))),
Ok(true) => return Some(Ok(parse_result.unwrap())),
Ok(false) => self.next(),
}
}
}

Лог от изпълнението

Compiling solution v0.1.0 (/tmp/d20210111-1538662-9x9qcl/solution)
warning: irrefutable while-let pattern
   --> src/lib.rs:247:9
    |
247 | /         while let x = &self.next()
248 | |         {
249 | |             if x.is_none()
250 | |             {
...   |
276 | |             writer.write("\n".as_bytes());
277 | |         }
    | |_________^
    |
    = note: `#[warn(irrefutable_let_patterns)]` on by default

warning: unused variable: `er`
   --> src/lib.rs:274:25
    |
274 |                     Err(er) => return Ok(()),
    |                         ^^ help: if this is intentional, prefix it with an underscore: `_er`
    |
    = note: `#[warn(unused_variables)]` on by default

warning: unused `std::result::Result` that must be used
   --> src/lib.rs:260:25
    |
260 |                         writer.write("\"".as_bytes());
    |                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |
    = note: `#[warn(unused_must_use)]` on by default
    = note: this `Result` may be an `Err` variant, which should be handled

warning: unused `std::result::Result` that must be used
   --> src/lib.rs:261:25
    |
261 |                         writer.write(hmap[key.as_str()].as_bytes());
    |                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |
    = note: this `Result` may be an `Err` variant, which should be handled

warning: unused `std::result::Result` that must be used
   --> src/lib.rs:262:25
    |
262 |                         writer.write("\"".as_bytes());
    |                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |
    = note: this `Result` may be an `Err` variant, which should be handled

warning: unused `std::result::Result` that must be used
   --> src/lib.rs:265:29
    |
265 | ...                   writer.write(", ".as_bytes());
    |                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |
    = note: this `Result` may be an `Err` variant, which should be handled

warning: unused `std::result::Result` that must be used
   --> src/lib.rs:276:13
    |
276 |             writer.write("\n".as_bytes());
    |             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
    |
    = note: this `Result` may be an `Err` variant, which should be handled

warning: 7 warnings emitted

    Finished test [unoptimized + debuginfo] target(s) in 4.48s
     Running target/debug/deps/solution_test-8916805fc40a2dab

running 15 tests
test solution_test::test_csv_basic ... FAILED
test solution_test::test_csv_duplicate_columns ... ok
test solution_test::test_csv_empty ... ok
test solution_test::test_csv_iterating_with_a_selection ... ok
test solution_test::test_csv_iterating_with_no_selection ... FAILED
test solution_test::test_csv_parse_line ... ok
test solution_test::test_csv_parse_line_with_commas ... ok
test solution_test::test_csv_selection_and_writing ... ok
test solution_test::test_csv_single_column_no_data ... FAILED
test solution_test::test_csv_writing_without_a_selection ... FAILED
test solution_test::test_csv_writing_without_any_rows ... ok
test solution_test::test_parsing_helpers_for_unicode ... FAILED
test solution_test::test_skip_next ... ok
test solution_test::test_take_and_skip ... FAILED
test solution_test::test_take_until ... FAILED

failures:

---- solution_test::test_csv_basic stdout ----
thread '<unnamed>' panicked at 'called `Option::unwrap()` on a `None` value', /tmp/d20210111-1538662-9x9qcl/solution/src/lib.rs:322:39
note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace
thread 'main' panicked at 'called `Option::unwrap()` on a `None` value', tests/solution_test.rs:60:5

---- solution_test::test_csv_iterating_with_no_selection stdout ----
thread '<unnamed>' panicked at 'called `Option::unwrap()` on a `None` value', /tmp/d20210111-1538662-9x9qcl/solution/src/lib.rs:322:39
thread 'main' panicked at 'called `Option::unwrap()` on a `None` value', tests/solution_test.rs:185:5

---- solution_test::test_csv_single_column_no_data stdout ----
thread 'main' panicked at 'attempt to subtract with overflow', /tmp/d20210111-1538662-9x9qcl/solution/src/lib.rs:125:21

---- solution_test::test_csv_writing_without_a_selection stdout ----
thread '<unnamed>' panicked at 'called `Option::unwrap()` on a `None` value', /tmp/d20210111-1538662-9x9qcl/solution/src/lib.rs:322:39
thread 'main' panicked at 'called `Option::unwrap()` on a `None` value', tests/solution_test.rs:224:5

---- solution_test::test_parsing_helpers_for_unicode stdout ----
thread 'main' panicked at 'byte index 1 is not a char boundary; it is inside '↓' (bytes 0..3) of `↓яга`', src/lib.rs:5:22

---- solution_test::test_take_and_skip stdout ----
thread 'main' panicked at 'byte index 5 is not a char boundary; it is inside 'б' (bytes 4..6) of `баба/яга`', src/lib.rs:42:39

---- solution_test::test_take_until stdout ----
thread 'main' panicked at 'assertion failed: `(left == right)`
  left: `("ба", "ба/яга")`,
 right: `("баба", "/яга")`', tests/solution_test.rs:121:5


failures:
    solution_test::test_csv_basic
    solution_test::test_csv_iterating_with_no_selection
    solution_test::test_csv_single_column_no_data
    solution_test::test_csv_writing_without_a_selection
    solution_test::test_parsing_helpers_for_unicode
    solution_test::test_take_and_skip
    solution_test::test_take_until

test result: FAILED. 8 passed; 7 failed; 0 ignored; 0 measured; 0 filtered out

error: test failed, to rerun pass '--test solution_test'

История (1 версия и 0 коментара)

Йордан качи първо решение на 09.01.2021 20:02 (преди почти 5 години)